消息传递框架MPNN： Neural Message Passing for Quantum Chemistry

最新推荐文章于 2024-07-16 20:59:21 发布

sanananana

最新推荐文章于 2024-07-16 20:59:21 发布

阅读量4.6k

点赞数 3

分类专栏：阅读笔记文章标签：无监督学习图计算机器学习

本文链接：https://blog.csdn.net/tagagi/article/details/121618312

版权

21 篇文章 4 订阅

订阅专栏

来源：ICML 2017

这篇论文本身没有提出什么新东西，基于以往的研究，提出了一个消息传递框架MPNN（Message Passing Neural Networks）,然后基于这个框架选择了一个较为高效的变体，应用到了chemical prediction中

1 为什么使用神经网络进行化学预测

在节点更新方面，消息传递框架大概可分为两个部分
1. 聚合周围节点的信息
2. 根据聚合到的信息得到该轮迭代中，自己的表征
在图级表征方面，当节点更新迭代完成之后，会有一个图级的读出函数，聚合所有节点的信息，得到图级表征
- M,U分别表示消息传递和节点更新的函数（神经网络）
- （1）式表示消息传递步骤，聚合一个点自身、邻居、边进行消息聚合
- （2）式表示节点更新，使用上一次迭代的特征h𝑣𝑇和本次迭代聚合到的信息𝑚𝑣𝑡+1得到h𝑣𝑡+1
- 得到图级表示的读出操作
- 需要保证排列不变性

目的：更改消息在整个模型中的传递方式（允许信息在传播阶段长距离传播）。两个方法：
1. 为未连接的成对节点添加单独的“虚拟”边类型。这可以作为数据预处理步骤来实现，
2. 使用潜在的“主”节点（master node），通过特殊的边来连接到图中任意一个节点。主节点充当了一个全局的暂存空间，每个节点都会在消息传递过程中通过主节点进行读取和写入。同时允许主节点具有自己的节点维度，以及内部更新函数（GRU）的单独权重。其目的同样是为了在传播阶段传播很长的距离

两种
1. GGNN中的读出函数：
2. 另外一种，Set2Set模型实现了排列不变性，可以作为一种更好的选择
  - Order matters: Sequence to sequence for sets - 知乎

实在不知道怎么翻译，大概意思是，原本的消息聚合需要𝑂𝑛2𝑑2的复杂度，很大，于是将嵌入分为𝑘份，每份单独进行消息聚合，然后最后将其拼接到一起，过一个神经网络，进行变换得到该层的表示：
从这个角度看很像多头注意力机制
计算复杂度简化为了：On2dk2

对于分子来说有很多可以提取的特征，比如说原子组成、化学键等：
分子图中边的三种表示形式
- Chemical Graph：不考虑距离，邻接矩阵的值是离散的键类型：单键，双键，三键或芳香键
- Distance bins：基于矩阵乘法的消息函数的前提假设是边信息是离散的，将键的距离分为 10 个 bin，比如说 [2,6]中均匀划分 8 个 bin， [0,2]为 1 个 bin，[6,+∞] 为 1 个 bin
- Raw distance feature：同时考虑距离和化学键的特征，邻接矩阵的每个实例都是一个 5 维向量，第一维是距离，其余四维是四种不同的化学键