题目:Learning the protein language of proteome-wide protein-protein binding sites via explainable ensemble deep learning
文献来源: COMMUNICATIONS BIOLOGY | (2023) 6:73
代码:http://www.edlmppi.top:5002/
简介:蛋白质-蛋白质相互作用(PPIs)通过影响蛋白质的功能表达来控制细胞的通路和过程。因此,准确的蛋白质相互作用结合位点的识别已成为蛋白质功能分析的关键步骤。然而,由于大多数计算方法都是基于生物学特征设计的,因此没有可用的蛋白质语言模型可以直接将氨基酸序列编码为分布式向量表示来建模其对蛋白质结合过程的特征。此外,实验检测到的蛋白质相互作用位点的数量远小于蛋白质-蛋白质复合物中的蛋白质相互作用或蛋白质位点的数量,导致数据集不平衡。为了解决这些问题,作者开发了一个基于集成深度学习模型(EDLM)的蛋白质-蛋白质相互作用(PPI)位点识别方法(EDLMPPI)。评估结果表明,EDLMPPI在Dset_448、Dset_72和Dset_164等三个广泛使用的基准数据集上优于包括多个PPI位点预测模型在内的最先进的技术,这表明EDLMPPI在平均精度上优于那些PPI站点预测模型近10%。此外,生物学和可解释的分析从不同的角度为蛋白质结合位点的鉴定和鉴定机制提供了新的见解。
-------------------------------------------
欢迎点赞收藏转发!
下次见!