随着基因组学的不断发展,lncRNA已被证明在各种生物学功能中发挥着重要的调控作用。最新的植物研究表明,lncRNA在控制开花时间、根器官生长和适应环境变化等关键过程中起着重要的作用。然而,与动物领域相比,植物领域的lncRNA研究相对滞后。同时,如何从大量的数据中找到可靠的lncRNA数据是植物lncRNA研究领域的关键问题。在细胞功能方面,lncRNA通常结合蛋白质发挥着非常重要的作用,如调控细胞成熟、细胞核输出和细胞稳定性等。目前,很多人工智能方法被用来预测lncRNA-蛋白质相互作用关系,但是这些方法仍存在一些问题。例如:这些方法可能需要过多的专业知识,未能充分利用序列特征,或仅在种类单一的lncRNA-蛋白质相互作用数据集进行实验。因此,本文基于机器学习和深度学习方法分别对植物lncRNA与lncRNA-蛋白寻找更多质相互作用关系展开研究,主要的研究内容为以下三点:(1)提出了一种基于序列特征的植物lncRNA识别方法。首先,该方法提取RNA的序列长度、GC含量和k-mer频率作为序列特征。其次,通过卡方检验方法从中提取特征子集,并在多个机器学习算法中确定了最优特征子集数量。最终,将最优特征输入机器学习算法中进行训练并识别出植物lncRNA,其中GBDT较其他分类算法表现出更优的性能。因此,本文所提出的基于序列特征的植物lncRNA识别方法具有较好的效果,有望推动植物基因组学研究的发展。同时,该方法在不同种类m RNA作为负样本的情况下仍然具有一定的稳定性与有效性。Docetaxel molecular weight(2)提出了一种基于序列特征编码的lncRNA-蛋白质相互作用关系深度网络预测模型RPIPCM。首先,基于RNA的四核苷酸子序列特征对其进行编码。然后,基于蛋白质的理化性质和三联体特征对其进行编码。最终,将特征编码完的RNA和蛋白质序列输入tunable biosensors由卷积神经网络和多层感知机搭建的深度网络进行预测并输出预测结果。实验结果表明,本文所提出的基于序列特征编码的深度网络模型实现了对不同种类lncRNA-蛋白质之间相互作用关系的准确预测,具备广泛的适用性和较高的预测精度。(3)设计并实现了Plnc-LPI系统。该系统使用Vue框架实现了植物lncRNA预测和lncRNA-蛋白质相互作用关系预测方法的可视化。此外,系统还提供了数据文件管理功能,以便用户上传和导出序列文件,更好地体现了本文研究工作的应用价值。