文献笔记:Graph Networks as a Universal Machine Learning Framework for Molecules and Crystals
文章链接:https://doi.org/10.1021/acs.chemmater.9b01294.
这篇文章提出了一种通用材料图网络(MEGNet)模型,用于分子和晶体的准确性能预测。
两种策略来解决数据限制:
1)将4个独立的分子MEGNet模型统一为一个单个自由能MEGNet模型。
2)从大数据集进行迁移学习。
Introduction
基于Graph的模型对原子描述符的选择不是很敏感。
晶体描述符需要考虑晶格周期性和额外的空间群对称性。CGCNNs中,每个晶体由一个晶体图表示,并且通过卷积和池化层实现原子指数排列和晶胞选择的不变性。
Limitations:
- 对formation energy预测性能不好;
2)现有的方法缺少对整体状态的描述;
3) 有些性能训练高性能模型还有瓶颈,因为数据量少。
Methods
1, update e
2. update v
3. update u
整体结构图:
数据收集:
QM9数据集包含130 462小有机分子(超过9个原子)
晶体数据69640个,用半径cutoff,69 239用于模型。
所有的晶体用于formation energy model和 是否是金属的classifier
45 901用于band gap regression.
5830用于弹性体模型
Results
QM9 Molecules
simple MEGNet只使用原子数目和空间距离作为原子和键的描述。
统一分子自由能模型
一个模型针对一个目标,但当多目标是一个物理关系具有相同的feature时,构建结合自由能模型。
晶体
增大截断半径进行敏感性分析;
讨论
分子和晶体是随意的?
这个工作的一个关键进步是展示了结合全局状态变量来构建相关属性的统一模型。
相关模型的统一可以在模型复杂性增加最小的情况下实现训练数据的多倍增加。
可解释性 Interpretability
可组合性Composability
数据限制和迁移学习
结论
总而言之,我们开发了 MEGNet 模型,这些模型在分子和晶体的各种目标属性中普遍具有高性能。 图是原子及其之间键的自然表示选择,图网络的顺序更新方案为原子、键和全局状态之间的信息流提供了一种自然的方法。 此外,我们在这项工作中展示了两项进步——结合全局状态输入和转移学习元素嵌入——将这些模型进一步扩展到状态相关和数据受限的属性。 这些概括解决了 ML 在化学和材料科学中应用的几个关键限制,并为开发通用属性模型以加速材料发现提供了坚实的基础。