Protein–RNA interaction prediction with deep learning:structure matters

标题:利用深度学习预测蛋白质RNA相互作用:结构很重要

期刊:Briefings in Bioinformatics

中科院分区/影响因子:Q1/11.622

发表时间:2022.1.19

一、摘要

蛋白质RNA相互作用对多种细胞活动至关重要。实验和计算技术都已经发展到研究相互作用。由于以往数据库的限制,特别是蛋白质结构数据的缺乏,现有的大多数计算方法严重依赖于序列数据,只有一小部分方法利用了结构信息。最近,AlphaFold彻底改变了整个蛋白质和生物学领域。可以预见的是,蛋白质RNA相互作用预测在未来几年也将得到显著的促进。在这项工作中,我们对这一领域进行了全面的回顾,调查了结合位点和结合偏好预测问题,并涵盖了常用的数据集,特征和模型。我们还指出了这一领域的潜在挑战和机遇。本综述总结了RNA结合蛋白-RNA相互作用领域在过去的发展,并预测了其在后AlphaFold时代的未来发展。

二、方法与数据集

37个子数据集对应37份RBP

方法:问题-预测环状RNA上RBPs结合位点的问题表述为一个二元分类问题。流程图如下:

 包含五个模块:浅层多视图数据构建模块、

基于混合深度网络的深度特征提取模块、

基于子空间表示学习的多视图公共特征提取模块、

多视图分类器的易解释训练模块和测试模块。

每个模块的简要描述如下:

(I)基于circRNA序列,浅层多视图数据构建模块从以下四个视图构建特征:

(a)基于RNAs和氨基酸序列之间潜在关系的伪氨基酸序列视图;

(b)考虑RNAs中的成分信息的伪二肽成分视图;

(c)考虑到RNA及其二级结构的相关性的RNA序列及其二级结构的组合视图;

(d)考虑circRNAs上的语义信息的序列嵌入的CircRNA2Vec视图。

(2)在深度特征提取模块中,我们构建了一个由CNN和BiLSTM组成的混合深度网络。然后用混合网络从上述四个视图的数据中提取深层特征。

(三)基于子空间表示学习的多视图共同特征提取模块主要用于从深度特征的四个视图中提取它们共同的高区分度特征。提取的共同特征能够更好地反映不同视图之间的一致性信息。

(4)训练多视图TSK-FLS得到一个具有模糊推理和协作学习能力的多视图分类器,该分类器是基于上述学习得到的多视图深度特征及其公共特征构建的。

(5)在测试模块中,首先使用前三个模块处理测试数据,以获得测试数据的五个视图。然后用训练好的多视角分类器对这个多视角测试数据进行预测,得到预测结果。

三、结果

     目前预测circRNAs上RBP结合位点的方法主要有CRIP、PASSION、CircSLNN和iCircRBP-DHN。第四部分,我们比较了现有的四种方法和我们的DMSK方法的性能。最后一部分是验证本文的DMSK方法是否可以推广到线性RNA数据集。上述实验都使用AUC(ROC曲线下面积)度量来评估模型的预测性能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值