AlphaFold2的思路总结(十五)

2021SC@SDUSC


这学期的代码分析工作接近尾声了,我想简单总结一下AlphaFold2的总体思路


  具体来看,AlphaFold2主要利用多序列比对(MSA),把蛋白质的结构和生物信息整合到了深度学习算法中。它主要包括两个部分:神经网络EvoFormer和结构模块(Structure module)。

一、EvoFormer

在这里插入图片描述
  在EvoFormer中,主要是将图网络(Graph networks)和多序列比对 (MSA)结合完成结构预测。
  图网络可以很好表示事物之间的相关性,在这里,它可以将蛋白质的相关信息构建出一个图表,以此表示不同氨基酸之间的距离。
  用Attention机制构建出一个特殊的“三重自注意力机制(Triangular self-attention)”,来处理计算氨基酸之间的关系图。
  然后,他们将这一步得到的信息与多序列比对结合。多序列比对主要是使相同残基的位点位于同一列,暴露出不同序列之间的相似部分,从而推断出不同蛋白质在结构和功能上的相似关系。计算出的氨基酸关系与MSA进行信息交换,能直接推理出空间和进化关系的配对表征。

二、Structure Module

  架构的第二部分是一个结构模块(Structure Module),它的主要工作是将EvoFormer得到的信息转换为蛋白质的3D结构。在这里,研究人员同样使用了Attention机制,它可以单独计算蛋白质的各个部分,称为“不变点注意力(invariant point attention)”机制。它以某个原子为原点,构建出一个3D参考场,根据预测信息进行旋转和平移,得到一个结构框架
在这里插入图片描述

  然后Attention机制会对所有原子都进行预测,最终汇总得出一个高度准确的蛋白质结构。
  此外,研究人员还强调AlphaFold2是一个“端到端”的神经网络。他们会反复把最终损失应用于输出结果,然后再对输出结果进行递归,不断逼近正确结果。这样做既能减少额外的训练,还能大幅提高预测结构的准确性。


总结

  学期末了,这门课快要结束了。回想这一学期对AlphaFold2的学习经历,感觉自己收获颇丰。这门课打开了我对于交叉学科的全新认识,让我意识到“人工智能+”的巨大魅力。同时我觉得多方面能力的提升甚至比对AlphaFold2的理解要更重要的多。
  通过这门课,我学会了自己查文献获取第一手的信息并且渐渐对英文阅读文献不再恐惧;我学会了如何结合论文阅读代码;我学习了tensorflow框架并且对python的掌握更加熟练了;我还自己多学习了很多深度学习的内容。
  当然了,在这过程我确实付出了很多努力。除了晦涩的代码以及难懂的论文之外,我还做了很多看不到的准备。对于一个深度学习和生物学相交叉的课题,我是一个完完全全的门外汉。为了能快速理解AlphaFold2究竟在做什么,我在bilibili和youtube上看了很多很多的视频讲解,尝试着入门。
  最后,我要特别感谢魏老师。感谢魏老师给我加入这个课程的机会,在我看来这有点像类似入门科研的经历,我觉得对我以后的发展会非常有帮助。还要感谢魏老师的耐心指导,在我最迷茫的时候给予了帮助,使得我的学习路线明朗了许多。

  • 5
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值