Alpha GO的诞生!DeepMind 用 AI发现「蛋白质折迭」规律

当人工智能在游戏像人一样掌握复杂的情境时, 科学家开始期待,人工智能也能解决科学问题。DeepMind 近日进攻医疗领域,从深度学习精准预测「蛋白质结构」上下手,获得更多关于蛋白质形状和它们如何运作的知识,以帮助目前科学无解的阿兹海默症、帕金森氏症,过去被认为近乎绝症的疾病,似乎也出现了一丝曙光。AlphaGo 和 AlphaZero 又有新兄弟,这次轮到科学家惊呆了。DeepMind 近日宣布,过去两年一直在研发 AlphaFold:一个用人工智能加速科学发现的系统。它仅仅基于蛋白质的基因序列,就能预测蛋白质的 3D 结构,而且结果比以前的任何模型都要精确。在「蛋白质结构预测奥运会」CASP 比赛中,力压其他 97 个参赛者。《卫报》报导称,AlphaFold 预测出了 43 种蛋白质中 25 种蛋白质的最精确结构。在同一类别中排名第二的队伍,只预测出了 3 种。

相关的研究者纷纷表示,DeepMind 厉害!很想知道他们方法的细节。对于这项研究,DeepMind 称其为「DeepMind 在科学发现领域的第一个重要里程碑」,在生物学的核心挑战之一上取得了重大进展。《卫报》评论称,这将「开启医学进步的新时代」。

 

到底是个多大的进展?

任何给定的蛋白质能做什么,取决于它独特的 3D 结构。所以,能精确预测蛋白质的 3D 结构意义非凡。首先,它能够帮助科学家更好地理解蛋白质在人体内的作用。对于 诊断和治疗由蛋白质错误折迭引起的疾病,比如阿兹海默症、帕金森氏症、亨廷顿氏症等 ,至关重要。其次,它会提高我们对身体及其工作原理的认识, 使科学家能够更有效地设计新的、有效的疾病治疗方法 。随着我们通过仿真和模型获得更多关于蛋白质形状和它们如何运作的知识,会使药物开发方面更容易,同时也会降低相关的实验成本。

 

第三,它也有助于更好地设计蛋白质,一个例子是,可以 推动可生物降解酶的进步,帮助我们控制像塑料和石油这样的污染物 。事实上,研究人员已经开始对细菌进行工程改造,使其分泌蛋白质,让废物可生物降解,进而变得更容易处理。不过,仅仅根据基因序列来确定蛋白质的 3D 形状是一项复杂的任务。挑战在于,基因序列中只包含蛋白质组成部分氨基酸残基的序列信息,这些氨基酸残基会形成长链。预测这些长链如何折迭成复杂的 3D 结构,被称为「蛋白质折迭问题」(protein folding problem)。蛋白质越大,氨基酸之间的相互作用越多,建模也就更复杂,困难度也会成倍上升。正如利文索尔佯谬(Levinthal’s paradox)中指出的那样,在找到一个蛋白质正确的 3D 结构之前,要列举一个典型的蛋白质所有可能的构型,需要的时间比宇宙存在的时间还要长。

那么,DeepMind 解决这个问题的思路是怎样的呢?

DeepMind 方案:基于深度神经网络

DeepMind 表示,他们专注于从零开始仿真目标形状,而不是使用以前解决的蛋白质作为模板。因此,在预测蛋白质结构的物理性质方面,DeepMind 达到了非常高的准确性,然后使用两种不同的方法,来构建完整的蛋白质结构预测。这两种方法都依赖深度神经网络,需要训练深度神经网络从基因序列中预测蛋白质的两种特性:

1) 成对的氨基酸之间的距离;

2) 连接这些氨基酸的化学键之间的角度。

具体的操作步骤为:

训练一个神经网络来预测蛋白质中每对残基之间的距离分布。然后,将这些概率组合成一个分数,用来估计一个蛋白质结构的准确度。此外,DeepMind 还训练了一个单独的神经网络,基于所有距离的总和来评估初步给出的蛋白质结构与正确答案的接近程度。然后,基于这些评分函数,去找到符合预测的结构。DeepMind 使用的第一种方法,基于结构生物学中常用的技术,用新的蛋白质片段反复替换蛋白质结构的片段,他们训练了一个生成神经网络来发明新的片段,用来不断提高蛋白质结构的评分。第二种方法是通过梯度下降法优化得分,这是机器学习中常用的一种数学技术,可以进行小的、增量的改进,从而得到高精度的结构。他们将这项技术应用于整个蛋白质链,而不是那些在组装前必须单独折迭的片段,从而减少了预测过程的复杂性。

 

还有「一吨」多的想法

DeepMind 的目标,是将 AlphaFold 打造成基础科学领域的 AlphaGo 和 AlphaZero。他们表示,我们首次涉足蛋白质折迭领域的成功表明,机器学习系统可以整合各种信息来源,帮助科学家快速找到复杂问题的创造性解决方案 。正如我们已经看到人工智能如何通过 AlphaGo 和 AlphaZero 等系统帮助人们掌握复杂的游戏一样,我们同样希望有一天,人工智能的突破也将帮助我们掌握基础的科学问题。DeepMind 的首席执行官 Demis Hassabis 对此信心满满。「我们还没有完全解决蛋白质折迭问题,这只是第一步,」他说。「这是一个极具挑战性的问题,但是我们有一个良好的体系,我们还有『一吨』多的想法还没有实施。」

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值