GCN-Graph Convolutional Networks

最新推荐文章于 2024-06-19 21:03:41 发布

s_daqing

最新推荐文章于 2024-06-19 21:03:41 发布

阅读量822

点赞数 1

分类专栏： tensorflow 文章标签： gcn

本文链接：https://blog.csdn.net/s_daqing/article/details/119617568

版权

30 篇文章 0 订阅

订阅专栏

CNN：

CNN一般作用于欧式空间，无法作用于非欧式空间，具有以下几个特点：

GCN背景:

具有可扩展的优点，能够适应网络的变化
相较于起传统的深度学习，图神经网络由于在关系数据挖掘方面有巨大的潜力，正成为学术界和工业界投入研发的热点，比如商品推荐，金融风控，聊天机器人中的语义分析及意图识别

对于一个图网络G=（V，E），有N个节点，每个节点都有自己的特征，目标是要学习图上的信号或特征的一个映射
在这里插入图片描述

保存的是Node之间的连接的性：
在这里插入图片描述

保存每个Node的边的数量，对角矩阵
在这里插入图片描述

L=D-A，之所以用D - A，是为了规范化，每一行每一列的和为0
在这里插入图片描述

对于一个图网络G=（V，E），有N个节点，每个节点都有自己的特征，目标是要学习图上的信号或特征的一个映射

GCN模型的输入为矩阵X和A：

GCN是一个神经网络层，层与层之间的传播方式
在这里插入图片描述

$\widetilde {A}=A+I$ , I是单位矩阵
$\widetilde {D}$ 是 $\widetilde {A}$ 的度矩阵（degree matrix），公式为： $\widetilde {D_{ii}}=\sum\widetilde {A}_{ij}$
H是每一层的特征，对于输入层的话，H就是X
σ是非线性激活函数
$\widetilde {D}^{ -\frac{1}{2}}\widetilde {A}\widetilde {D}^{ -\frac{1}{2}}$ 可以提前算好，固定不变
公式解释：http://tkipf.github.io/graph-convolutional-networks/
每一层GCN的输入都是邻接矩阵A和node的特征H，如果我们直接做一个内积，乘一个参数矩阵W，再激活一下，就相当于一个简单的神经网络层

实验证明，使用这个简单的神经网络层，就已经很强大了
不过这个简单模型有2个局限性：

局限1，只使用A的话，由于A的对角线上都是0，所以在和特征矩阵H相乘的时候，只会计算一个node的所有邻居的特征的加权和，该node本身的特征却被忽略了
优化方法：可以做一个小改动，即给A加上一个单位矩阵I，这样就让对角线元素变成1了

局限2，A是没有经过归一化的矩阵，如果A与特征矩阵H相乘会改变特征原本的分布，产生一些不可预测的问题

对A做一个标准化处理，首先让A的每一行加起来为1，然后对A乘以 $D^{-1}$ ，D为度矩阵，可以解决局限2
进一步把 $D^{-1}$ 拆开与A相乘，得到一个对称且归一化的矩阵: $\widetilde {D}^{ -\frac{1}{2}}\widetilde {A}\widetilde {D}^{ -\frac{1}{2}}$
结合这两种改进的方式，得到：

这里 $\widetilde {A}=A+I$ , I是单位矩阵， $\widetilde {D}$ 是 $\widetilde {A}$ 的度矩阵（degree matrix）

关注

专栏目录