受体相互作用丝氨酸/苏氨酸蛋白激酶1(RIPK1)是炎症和细胞死亡的关键调节因子,并且也是一个与癌症、银屑病、溃疡性结肠炎、类风湿性关节炎、阿尔茨海默病(AD)、多发性硬化症(MS)和肌萎缩侧索硬化症(ALS)等各种疾病有关的重要靶点,抑制RIPK1已被证明是医治上述疾病的可行方法。AD是一种最常见的神经退行性疾病,也是老年人中最主要的痴呆症疾病,它已成为了世界十大死亡原因之一,研究已经表明了AD与受RIPK1调控的坏死性死亡密切相关。此外,最近的其他研究表明,SARS-COV-2通过促进RIPK1的激活来加快病毒增殖,抑制RIPK1则可以降低肺器官中SARS-Co V-2的病毒载量。虽然抑制RIPK1的活性可以治疗各种相关疾病,但到目前为止,还未有任何RIPK1抑制剂获得美国食品药品监督管理局(FDA)的批准。在此背景下,继续寻找高疗效、低毒性的潜在抑制剂是十分必要且具有重大意义的。鉴于此,本文使用了随机森林(RF)、极端随机树(ET)、极端梯度提升树(XGBoost)和轻量梯度提升机(Light GBM)四种机器学习算法,结合扩展连通性指纹(ECFP)构建了四个QSARFG-4592分类模型以预测该蛋白在已知化学空间中潜在的小分子抑制剂。随后,通过相关的评价指标进行性能检验,根据七个评价标准的指示,四个模型均表现的相当出色,所以采用了所有模型的全部预测结果。为了提高活性分子的命中率以及类药性,我们使用RDKit计算了一些如Log P、分子质量(MW)、可旋转键(ROTB)等性质进行初步过滤,最终在ZINC数据库中约13万的子数据集里得到了9769个可能的活性化合物。随后,通过分子对接进一步筛选,并给出了全部的对接结果。考虑到单纯的按照打分顺序选择符合药理性Cultural medicine质的分子可能会得到冗余的类似物,所以进行了聚类分析。根据轮廓系数以及总离差平方和的指示,聚成了六个类别并在每个类别中选择1个分子,总计六个分子其药理性质也满足相应的要求。最后,对最终命中的分子进行动力学模拟,并计算了一系列评价指标以验证其结合稳定性。此外,还应用了Shapley可加性解释方法(SHAP)来进一步说明这些分子指纹片段是如何影响模型决策的。根据该方法确定了1855位(bit)是最重要的分子指纹片段,其次为819,这为基于片段的药物设计(FBDD)提供了依据。目前研究数据表明,六个筛选得到的小分子是很有希望靶向RIPK1治疗相关疾病的,Tofacitinib试剂并且分子动力学的模拟结果也进一步证实了它们与靶蛋白的结合稳定性。其中值得注意的是,筛选得到的ZINC000085897746小分子存在于芭蕉科植物野果香蕉(Musa acuminate)中,这代表该分子是天然产物,所以它非常值得被高度关注并做重点研究。