【GNN】MPNN：消息传递神经网络

最新推荐文章于 2025-03-20 15:32:30 发布

阿泽的学习笔记

最新推荐文章于 2025-03-20 15:32:30 发布

阅读量1.3w

点赞数 27

分类专栏：人工智能 GNN Embedding 文章标签：算法 GNN 图神经网络 GCN 人工智能

本文链接：https://blog.csdn.net/qq_27075943/article/details/106623059

版权

本文深入探讨了消息传递神经网络（MPNN）的框架，包括消息函数、更新函数和读出函数的定义，以及其在分子预测任务中的应用。通过实例分析了不同模型如何适应MPNN框架，并指出MPNN在处理化学任务时的优越性，强调了其在图神经网络中的重要地位。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天学习的是谷歌大脑的同学 2017 年的工作《Neural Message Passing for Quantum Chemistry》，也就是我们经常提到的消息传递网络（Message Passing Neural Network，MPNN），目前引用数超过 900 次。

严格来说，MPNN 不是一个模型，而是一个框架。作者在这篇论文中主要将现有模型抽象其共性并提出成 MPNN 框架，同时利用 MPNN 框架在分子分类预测中取得了一个不错的成绩。

1.Introduction

深度学习被广泛应用于图像、音频、NLP 等领域，但在化学任务（分子分类等）中仍然使用中机器学习+特征工程的方式，其主要原因在于目前尚未有工作证明深度学习在这个领域能取得很大的成功。

近年来，随着量子化学计算和分子动力学模拟等实验的展开产生了巨大的数据量，大多数经典的技术都无法有效利用目前的大数据集。而原子系统的对称性表明，能够应用于网络图中的神经网络也能够应用于分子模型。所以，找到一个更加强大的模型来解决目前的化学任务可以等价于找到一个适用于网络的模型。

在这篇论文中，作者的目标是证明：能够应用于化学预测任务的模型可以直接从分子图中学习到分子的特征，并且不受到图同构的影响。为此，作者将应用于图上的监督学习框架称之为消息传递神经网络（MPNN），这种框架是从目前比较流行的支持图数据的神经网络模型中抽象出来的一些共性，抽象出来的目的在于理解它们之间的关系。

鉴于目前已经有很多类似 MPNN 框架的模型，所以作者呼吁学者们应该将这个方法应用到实际的应用中，并且通过实际的应用来提出模型的改进版本，尽可能的去推广模型的实际应用。

本文给出的一个例子是利用 MPNN 框架代替计算代价昂贵的 DFT 来预测有机分子的量子特性：

2.MPNN

本节内容分为两块，一块是看下作者如何从现有模型中抽象出 MPNN 框架，另一块是看下作者如何利用 MPNN 框架去解决实际问题。

2.1 MPNN framework

我们先来介绍下 MPNN 这一通用框架，并通过八篇文献来举例验证 MPNN 框架的通配性。

简单起见，我们考虑无向图 G，节点 v 的特征为 $x_v$ ，边的特征为 $e_{vw}$ 。前向传递有两个阶段：一个是消息传递阶段（Message Passing），另一个是读出阶段（Readout）。考虑消息传递阶段，消息函数定义为 $M_t$ ，顶点更新函数定义为 $U_t$ ，t 为运行的时间步。在消息传递过程中，隐藏层节点 v 的状态 $h_v^t$ 可以被基于 $m_v^{t+1}$ 进行更新：
$\begin{aligned} m_v^{t+1} &= \sum_{w\in N(v)}M_t(h_v^t, h_w^t,e_{vw}) \\ h_v^{t+1} &= U_t(h_v^t, m_v^{t+1}) \end{aligned} \\$
其中， $N (v)$ 表示图 G 中节点 v 的邻居。

读出阶段使用一个读出函数 R 来计算整张图的特征向量：
$\hat y = R({h_v^T | v \in G}) \\$
消息函数 $M_t$ ，向量更新函数 $U_t$ 和读出函数 $R$ 都是可微函数。 $R$ 作用于节点的状态集合，同时对节点的排列不敏感，这样才能保证 MPNN 对图同构保持不变。