综述:深度学习在蛋白质结构预测中的最新进展

1. 问题引入

  • 长期以来,结构生物信息学领域一直使用机器学习方法,尤其是人工神经网络(NN)模型。PHD,PSIPRED和JPred是当今仍广泛使用的早期NN方法的杰出代表。

  • DNN对CASP产生重大影响的第一个应用领域是残基-残基接触预测,这在CASP12和13中的准确性上有特别明显的提高。在CASP13中,一些小组将这些技术进一步扩展到了原子间距离的预测,在某些情况下可以将其直接用于精确的三级结构生成。

  • 文章贡献

    • 为CASP参与者和观察者提供对最重要的、已在最近的CASP实验中成功应用于核心问题领域的DNN体系结构工作的理解。
    • 讨论这些模型相对于在各个领域中传统使用的模型可能具有的优势。
    • 对这些模型为何以及如何工作、它们的局限性、潜在的缺陷以及正确的应用进行一些讨论。(所有讨论将仅限于监督学习模型,因为迄今为止在CASP中使用的性能最高的DNN模型就是这种类型)

2. 蛋白质结构预测中使用的卷积神经网络

  • 感受野

    这仅是指可以随时看到输入图像的区域(或更一般地说,输入特征集)。具体而言,感受野是用于计算单个输出值的输入的空间范围,通常是针对网络中给定卷积层(最常见的是最后一个)中的单个神经元计算的。由单层3×3卷积核组成的网络中的输出神经元将具有3×3的感受野,因为网络对每个输出像素进行的最终计算仅考虑输入中的中心像素及其直接邻居(图 1)。但是,将模型与连续的卷积层组合在一起,可以增加感受野;即每个输入像素周围的区域,可以在计算最终层的输出时将其包括在内(参见图2A)

  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
蛋白质结构预测是生物信息学的一个重要课题,也是当前深度学习技术应用于生物科学领域的热点之一。目前,基于深度学习蛋白质结构预测方法主要分为三类:基于序列的方法、基于结构的方法和基于序列和结构的融合方法。 基于序列的方法主要使用卷积神经网络(CNN)和循环神经网络(RNN)进行预测。这类方法主要是通过分析蛋白质序列的信息来预测蛋白质结构。其,CNN能够有效地提取蛋白质序列的特征信息,而RNN则能够处理序列的时序依赖关系。 基于结构的方法主要使用图卷积网络(GCN)和自注意力机制(Self-Attention)进行预测。这类方法主要是通过分析蛋白质结构的信息来预测蛋白质结构。其,GCN能够有效地提取蛋白质结构的特征信息,而Self-Attention则能够捕捉蛋白质结构的长程依赖关系。 基于序列和结构的融合方法主要使用深度神经网络进行预测。这类方法主要是通过将蛋白质序列和结构信息进行融合来预测蛋白质结构,从而提高预测精度。其,常用的深度神经网络包括多层感知器(MLP)、长短时记忆网络(LSTM)和残差网络(ResNet)等。 总体来说,基于深度学习蛋白质结构预测方法在预测精度上取得了显著进展,但仍然存在一些问题,如数据集的不足和噪声问题等。未来,随着大规模蛋白质结构数据的积累和深度学习技术的不断发展,基于深度学习蛋白质结构预测方法将会得到更广泛的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值