Inverse design of 3d molecular structures with conditional generative neural networks（2022论文阅读）

小沈的代码库

已于 2022-04-29 16:00:21 修改

阅读量1.5k

点赞数 2

分类专栏：自用笔记文章标签：深度学习神经网络机器学习

于 2022-04-29 15:59:08 首次发布

本文链接：https://blog.csdn.net/hanyuyuzu/article/details/124496274

版权

自用笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

摘要

简介

方法

用条件生成神经网络对三维分子结构进行逆向设计

2022 Natre Communicaions

最近读了一篇蛮有意思的文章，这里把主要思想整理了一下，这部分主要包括论文提到的生成模型的介绍，以及涉及的公式的介绍（其中有些一些自己在阅读过程中的问题（Q开头的句子））。

论文的全部翻译可自行下载：用条件生成神经网络对三维分子结构进行逆向设计-深度学习文档类资源-CSDN文库

摘要

合理设计具有理想特性的分子是化学领域的一个长期挑战。生成神经网络已经成为一种强大的方法，可以从学习到的分布中抽取新分子。在这里，我们提出了一个条件生成神经网络，用于具有特定化学和结构特性的三维分子结构。这种方法与化学键无关，可以从条件分布中对新分子进行有针对性的取样，即使在参考计算稀少的领域。我们展示了我们的方法在逆向设计中的实用性，通过生成具有特定主题或组成的分子，发现特别稳定的分子，以及联合针对训练制度以外的多种电子特性。

Q、生成的分子结构是现实中没有的吗？

有的，但是我们要是在制药中选择一种有特定作用的化合物比较难找到各方面性能都很合适的。从而用生成模型去生成，再去找生成的化合物来做实验。如果每个化合物都做实验的话，效率就会很低。

可以认为是只要是合理的结构就是可以合成的吗？在计算机里面合成和在现实的情况下合成是有区别的吧？可能这个东西在样本库里面很少在现实中怎么会更加稳定，要么不稳定，要么不好合成。

Q、合理的理想特性是怎么保证可以得到的？加入条件算就交叉熵。

Q、与化学键无关？就是怎么能保证我生成的这个东西真的可以用呢？不会生成一些很奇怪的东西吗？

有一个判断的方法，就是对生成的结构匹配化学键编号，检测可用性。

Q、逆向设计？

就是根据需要生成一个化学结构式，根据这个结构式去找合适的分子结构。

Q、训练样本是什么，3D总不能是图片吧？

应该是一个向量or矩阵这里还不是很明了诶

简介：

在这项工作中，我们提出了条件性G-SchNet（cG-SchNet），一个用于分子逆向设计的条件性生成神经网络。在G-SchNet的基础上，该模型根据结构或化学特性学习条件分布，使我们能够对相应的三维分子结构进行采样。我们的架构旨在生成任意大小的分子，不需要指定目标成分（化学键 官能团？）。因此，它可以学习分子的组成和它们的物理特性之间的关系（分子的结构--对应物理特性），以便对表现出给定目标特性的候选分子进行采样，例如，在针对小的极化率时更倾向于较小的结构（？）。以前提出的方法通过调整训练目标或数据，每次都偏向于一组特定的目标属性值48,51（这种方法为什么会有偏向呢？）。相比之下，我们的条件性方法允许在训练完成后搜索具有任何所需目标属性值的分子。它能够共同瞄准多个属性，而不需要重新训练或以其他方式间接约束采样过程。这为该模型利用训练数据的全部信息提供了基础，从而提高了泛化和数据效率。我们证明了cG-SchNet能够探索人口稀少的区域，而这些区域用无条件模型是很难达到的。为此，我们对不同的调节目标进行了广泛的实验，包括化学性质、原子组成和分子指纹。通过这种方式，我们产生了具有预定结构图案的新分子、表现出特定化学性质的特定成分的异构体，以及共同优化HOMO-LUMO间隙和能量的新配置。这表明我们的模型能够灵活地、有指导地探索化合物空间。

Q、就是在原来的基础上加上了条件吗？

可以这么说，加上条件之后训练的数据的选取和训练方式有所区别了，原来的G-SchNet应该是通过改变训练数据的倾向性来改变输出的倾向性（我想模型生成具有性能A的结构，用含有性能A的结构训练模型）。而cG-SchNet只要把A作为条件就可以实现性能A的结构的生成。

Q、关键是，这个模型可以学习到分子的组成和其物理成分之间的关系。为什么别的网络就不能学到呢？或者说能学到的网络有什么样的结构上的特点，或者数据上的特点，（输入的数据是怎么样的？什么样的数据拿来训练，输出的结果是什么样的数据呢？）

Q、这个生成性网络的构造是什么样的？在方法部分

Q、加入了什么条件？如何确定的这些条件？

标量，矢量，embeding之后过全连接网络，这些被写进去的条件应该是相关化学性能，某些官能团和分子结构等。

Q、训练的数据是什么？肯定不是三维结构的映射吧？后面会讲训练数据怎么来的，但是不太懂，文中的训练分子样本挺多的

Q、学习分子的组成和它们的物理特性之间的关系（how？）：设定合适的loss函数（本文为交叉熵）

方法

用cG-SchNet生成有针对性的三维分子。

1、cG-SchNet学习分子的条件分布的因子化，即以目标属性为条件的原子位置和原子类型的联合分布。（模型在学什么？）

2、一个分子的具体生成流程：

这个是具体的生成过程示意图

1、在未完成的分子里面随机的选取一个原子作为交点focus：原子类型在下面那行（除了碳、氢、这种原子类型之外还有两个辅助标记（focus、origin）后面会讲怎么用）

2、未完成分子的所有结构的位置和类型作为条件，以及性能条件，预测下一个原子的类型，如果stop则1，如果非则3

3、未完成分子的所有结构的位置和类型作为条件，以及性能条件，以及该原子的类型为条件预测相对位置分布

4、有一个3d的网格以焦点原子为中心的，确保下一个原子的位置离焦点最近，（算出来的距离要对应网格的位置，要进一步处理的，比如离散化等）

5、得到下一个原子的位置

6、把原子放上去，直到所有的原子都marked为止

3、cG-SchNet模型结构

cG-SchNet架构的输入和输出的示意图。

"⊕"代表连接（这里好像是串联），"⊙"代表Hadamard乘积（对应元素相乘）。

左图：用SchNet提取代表未完成分子的原子特征向量，条件被单独嵌入，然后连接起来以提取条件特征向量。确切的嵌入取决于条件的类型（如标量或矢量值）。

中间：从提取的特征向量中预测下一个原子的类型分布。

右边：根据提取的特征向量和下一个原子的采样类型，预测下一个原子与未完成分子中每个原子/标记之间的成对距离分布。关于构件的细节，Methods部分。

Q、MLP 是什么？感知机网络（这里全连接）