与吴恩达创办Coursera后，她一头扎进数字生物学

OneFlow深度学习框架

已于 2022-03-30 09:49:21 修改

阅读量5.4k

点赞数 1

分类专栏：业界观点文章标签：大数据 python 机器学习人工智能 alphafold

于 2022-03-29 08:01:00 首次发布

本文链接：https://blog.csdn.net/OneFlow_Official/article/details/123815215

版权

本文讲述了Insitro创始人Daphne Koller如何利用大数据、机器学习技术改变药物研发，解决传统药物研发效率低下的问题。她认为，机器学习在药物发现中的应用可以帮助构建新的药物设计过程，提高预测能力，减少失败率。Daphne还讨论了AlphaFold在蛋白质结构预测的成功，以及生物学、数据科学和工程学融合带来的科学新时代——数字生物学。

摘要由CSDN通过智能技术生成

来源｜wandb.ai

翻译｜刘畅

随着新药研发难度越来越大，机器学习成为了该领域的重要破局工具。2020年年底，在国际蛋白质结构预测赛中，DeepMind公司研发的AlphaFold 2摘得桂冠，并破解了蛋白质折叠这个困扰人类50年的难题，轰动一时，新药研发也成为热点话题。不过，这个领域早有不少开拓者。

2018年2月，AI新药研发公司Insitro成立，2021年完成C轮融资后累积资金额达7.43亿美元。该公司致力于利用大数据、机器学习以及生命科学领域的融合创新技术，重新构建药物设计过程，他们希望以一种新范式改变这一领域。创始人兼首席执行官Daphne Koller称“数字生物学”将成为下一个科学新时代的大机遇。

作为AI领域的知名学者，Daphne Koller在18岁就从耶路撒冷希伯来大学获得硕士学位，26岁成为斯坦福大学计算机系助理教授，曾获麦克阿瑟“天才奖”，是美国工程院院士、美国艺术与科学院院士，并在Science、Cell等顶尖学术期刊发表论文200多篇，H因子高达145。想必很多机器学习从业者应该读过她的概率图模型经典著作《Probabilistic Graphical Models: Principles and Techniques》。

不止于此，在2012年，Daphne与吴恩达共同创立了世界上最大的在线教育平台之一Coursera，目前市值超30亿美元。2020年，她还创立了高等教育数字学习平台Engageli。

在机器学习节目Gradient Dissent中，Lukas Biewald与他这位曾经的斯坦福大学老师聊了聊由“数字生物学”开启的科学新纪元，以及机器学习在药物发现中的作用及其面临的挑战。

以下为对话内容，OneFlow社区做了不改变原意的编译。

倒摩尔定律、机器学习与新药研发

Lukas：很激动再一次和你交流，我最想跟你聊的是Insitro，它看起来非常有趣且激动人心。

Daphne：Insitro是一家药物研发公司。如果你在过去50年里一直关注药物发现，会发现我们为东北亚地区的患者提供药物方面取得了巨大进步。但与此同时，根据 “倒摩尔定律”（Eroom's Law，摩尔定律的扩展），药物研发的生产率呈指数级下降。这是因为发现和研发药物的过程非常复杂和漫长。实际研发时，可能需要数月甚至数年的时间，以及耗费数百万美元甚至数千万美元才能意识到我们走错了方向。

因此，我们所要做的是使用机器学习的方式来构建公司，毕竟，这是帮助我们在其它许多领域做出真正有效地预测的技术，并将其作为一种在完全不同的基础上构建药物发现和开发过程的方法。这就是我们真正想要做的，给患者带来更好的药物，并且更快地完成研发。

Lukas：高水平的药物发现标准过程是什么？机器学习的适用性或可改进的地方有哪些？

Daphne：我不知道人们是否真的可以谈论出一个标准的过程，因为在过去几年里，这是一个不断发展的过程。药物发现的研究在学术中心进行，它是一系列生物学方面的研究，旨在揭示与疾病有关的基因和生物学机制、途径。然后有人提出了一个假设，如果对基因进行干预，它可能会治愈或至少有助于疾病治疗，而治愈是一个非常宽泛且雄心勃勃的词，我们治愈了一些罕见疾病，这也有助于治疗其他某些疾病。

首先，你必须确认目标。通常是用动物实验来模拟疾病的某些方面。对于我们今天所患的许多疾病来说，动物并不是自然患病的。所以你必须在动物身上制造疾病，然后尝试在动物身上解决它。通常情况下，你所解决的并不是真正的疾病，因为有些模拟非常不精确，有时甚至是完全错误的。

然后，一旦有了目标，通常会寻找一种帮助调节目标的化学物质。它有不同的治疗方式，也就是不同的干预方式。不管怎样，30、40年前我们的主要治疗方式是使用小分子。然后出现了生物制品，它们是更大的分子。现在基本上是蛋白质和抗体，抗体也是一种蛋白质，它在许多情况下更有用，但目标范围更窄且更难实现。

随着时间的推移，过去两年中出现了更多的治疗方式，帮助干预身体和其他类型的机理。在人们都在谈论基因治疗的情况下，我们可以介入并干预DNA本身。目前为止，只有很少的领域得到了批准，但这是一个不断发展的领域。如今使用的COVID-19疫苗，人们谈论的RNA治疗是对RNA级别的DNA和蛋白质进行干预。

因此，所有这些方法都是在扩大对人体进行智能干预的能力，从而对疾病过程进行干预。通常情况下，它失败的地方在于一开始我们根本不了解生物学。因此，我们在干预目标时的识别能力，对临床的益处实际上非常有限。很多时候，我们猜错了。有时，我们也无法理解干预特定目标可能带来的所有其他影响，比如特定基因在身体里做了其它预料不到的事情，如果我们以一种想象上可能有益于身体的方式进行干预，反而可能是有害的。

这就是我们做出有效预测能力比较