文 | Google Brain 团队研究员 George Dahl
最近,在化学行业涌现了许多激动人心的机器学习 (ML) 应用,特别是在解决化学检索问题方面,从药物发现和电池设计到寻找更好的 OLED 和催化剂,层出不穷。历史上,化学家一直使用薛定谔方程式的数值逼近(例如密度泛函理论 (DFT))来进行此类化学检索。
然而,计算这些近似值的开销限制了检索的规模。为了实现更大规模的检索,几个研究小组建立了机器学习模型,使用 DFT 生成的训练数据(例如 Rupp et al. 和 Behler and Parrinello)预测化学性质。在开展前述工作之前,我们一直使用各种现代机器学习方法来开发 QM9 基准库,这是一组公开的分子库,其中提供了根据 DFT 理论计算得出的各种分子的电子、热力学和振动特性。
我们最近发布了两篇论文,介绍了我们在此领域的研究成果,这些成果源自 Google Brain 团队、Google Accelerated Science 团队、DeepMind 和巴塞尔大学的密切合作。第一篇论文介绍了一种新的分子影像制作方法以及一种评估开发 QM9 基准库所用的各种机器学习方法的系统化评估方法。在对此基准库尝试过许多现有方法之后,我们曾致力于改进最有希望的深度神经网络模型。
其结果是,我们发表了第二篇论文“量子化学的神经消息传递”(Neural Message Passing for Quantum Chemistry),其中介绍了一个称为消息传递神经网络 (Message Passing Neural Net