BIB|LDAformer:基于拓扑特征提取和Transformer编码器的lncRNA-疾病预测
最近搞了个公众号《AI and Bioinformatics》介绍应用于生物信息学的人工智能算法和研究进展,以及网络表示学习算法研究,欢迎向本公众号投稿文献解读类原创文章,可以是自己or自己组的论文,也可以是阅读觉得不错的论文。投稿邮箱:nan_sheng@yeah.net
今天给大家推荐的是四川大学朱敏教授团队发表在期刊Briefings in Bioinformatics上的一篇关于lncRNA-疾病关联预测文章。
摘要
长非编码RNA(lncRNA)-疾病关联的识别对疾病诊断和治疗具有重要价值,目前常用计算方法预测潜在的lncRNA-疾病相关性。然而,现有的方法在数据处理过程中没有充分提取关键特征,学习模型部分要么功能不够强大,要么过于复杂。因此,通过改进这两个方面,仍有可能实现更好的预测性能。在这项工作中,本文提出了一种新的基于拓扑特征提取和Transformer编码器的lncRNA-疾病关联预测方法LDAformer。通过整合lncRNAs、疾病和microRNAs(miRNAs)之间的关联来构建异构网络。层内相似性和层间关联表示为lncRNA-disease-miRNA加权邻接矩阵,以统一语义。接下来,设计了一个拓扑特征提取过程,以进一步获得隐含在邻接矩阵中的多跳拓扑路径特征。最后,为了捕获异构路径之间的相互依赖关系,使用基于全局自注意机制的Transformer编码器来预测lncRNA-疾病关联。高效的特征提取和直观而强大的学习模型带来了理想的性能。对两个数据集的计算实验结果表明,本文的方法优于最先进的基线方法。此外,案例研究进一步表明,它能够准确地发现新的关联。
参考资料:
Zhou Y, Wang X, Yao L, et al. LDAformer: predicting lncRNA-disease associations based on topological feature extraction and Transformer encoder[J]. Briefings in Bioinformatics, 2022.