虽然我是生信人员,但是我研究生阶段做的内容跟蛋白结晶有关,蛋白的三维结构非常重要,只可惜当时的我能力有限,仅仅是用swissmodel模拟一下就算了,下面的图是我当年硕士毕业发表文章的分析结果, 但不得不承认,当时的课题草草了之,现在看来,甚为遗憾,不过今日,是时候回归了。
去年,DeepMind公司开发的AlphaFold2人工智能系统,基于氨基酸序列,精确预测了蛋白质的3D结构。它的准确性与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。这一突破被誉为“变革生命科学和生物医学”的突破。
几天前,DeepMind公司在《自然》杂志上发表论文,公开了进一步优化的AlphaFold2人工智能系统的源代码并且详细描述了它的设计框架和训练方法。同日,华盛顿大学(University of Washington)蛋白设计研究所David Baker教授课题组在《科学》杂志上发表论文,公布了其开源人工智能系统RoseTTAFold的研究结果。《自然》上发表的评论指出,这些论文和人工智能系统资源的发布,不但让基于DeepMind开发的AI系统预测蛋白质结构的技术能够为广大科学家和研究人员使用,而且有望进一步激发这一领域的进展。
蛋白质对生命来说不可或缺,它们支持生物体的几乎所有功能。这些复杂的大分子由氨基酸链构成,而蛋白质的功能很大程度上决定于它的3D结构。生物医学领域的众多挑战,包括开发治疗疾病的创新疗法,依赖于对蛋白质结构和功能的理解。
在过去的五十年中,科学家们已经能够利用冷冻电子显微镜、核磁共振或 X 射线晶体学等实验手段在实验室中确定蛋白质的形状,但每种方法都依赖于大量的试错,耗时耗力,可能需要花上好几年时间。1972年,诺贝尔化学奖得主Christian Anfinsen博士表示,理论上,蛋白质的氨基酸序列应该能够完全决定它的3D结构。这一假说激发了50年来基于氨基酸序列,通过计算方法预测蛋白质3D结构的探索。
在2018年,DeepMind开发的AlphaFold人工智能系统首次在国际蛋白质结构预测竞赛(CASP)上亮相。而在去年的CASP上,DeepMind的AlphaFold2系统表现惊艳,在接受检验的近100个蛋白靶点中,AlphaFold2对三分之二的蛋白靶点给出的预测结构与实验手段获得的结构相差无几。有些情况下,已经无法区分两者之间的区别是由于AlphaFold2的预测出现错误,还是实验手段产生的假象。
AlphaFold2根据氨基酸序列预测的蛋白结构与实验手段解析的结果几乎完全重合(绿色,实验结果;蓝色,计算预测结果)
DeepMind发布的更新版AlphaFold2在去年的系统基础上进行了优化,在解析蛋白结构的速度上有了进一步的提高。主要开发人员John Jumper博士说,这一系统的处理速度快了大约16倍。根据蛋白的大小,它可以在几分钟到几小时内生成准确的蛋白结构。
image