全文共3948字,预计学习时长10分钟
图源:unsplash
2020年,在几何和图形机器学习论文中表现突出的,当属生物化学、药物设计和结构生物学。这可能是第一次,我们终于发现这些机器学习方法对基础科学的影响。本文中,我将重点介绍三篇论文,这三篇论文是过去一年内我感触最深的论文(笔者是其中一篇论文的共同作者)。
几何机器学习方法曾被刊登在《细胞》和《自然方法学》杂志2020年2月刊的封面上。
第一篇论文:
J. M. Stokes et al., A deep learning approach to antibiotic discovery (2020) Cell 180(4):688–702.
关于什么?基于图形神经网络研发抗菌药物的深度学习操作流程。
如何操作?经训练的图神经网络用于预测大肠杆菌在多于2000个已知抗菌活性分子(包括批准抗生素、动植物提取物)数据集上的生长抑制。这种预测只是基于分子图,并不依赖于任何其他辅助信息,如药物作用机制等。
训练模型被送到药物再利用中心,经调查研究,模型中含有约6000种药物分子,前100种分子被选作试验测试对象。令人吃惊的是,一种实验抗糖尿药物halicin(海利霉素)具备有效的抗菌效果,能够消灭实验小鼠体内的多种抗药病菌。
显然,图神经网络具备良好普适性,因为halicin分子不同于传统抗生素。但是在这篇论文中,还并不清楚这种预测能力是否可以归结为预测一种抗菌作用的简单模式(细胞膜去极化)。
此外,研究人员还对ZINC15数据库中超过1亿个分子结构进行实验筛选,ZINC15数据库是专门为虚拟筛选而准备的商业可用化合物数据库&#