《第6章-GCN的性质》学习笔记

最新推荐文章于 2024-09-06 16:48:24 发布

智慧的旋风

最新推荐文章于 2024-09-06 16:48:24 发布

阅读量738

点赞数

分类专栏：论文和书籍阅读（GNN）文章标签：机器学习人工智能深度学习算法

本文链接：https://blog.csdn.net/weixin_41650348/article/details/109562279

版权

论文和书籍阅读（GNN）专栏收录该内容

21 篇文章

订阅专栏

第6章-GCN的性质

GCN指的是利用上一章定义的图卷积层堆叠而成的模型。

6.1 GCN与CNN的联系

在这里插入图片描述

6.2 GCN能够进行端到端学习

端到端（end-to-end）学习实现了一种自动化从数据中高效学习的机制。端到端学习能取得良好的效果依赖于基于某个特定问题的定制化网络层的构建。

图数据包含两部分信息：

属性信息：节点的固有性质
结构信息：节点间的关联性质

需要对这两部分信息进行端到端的学习。

图数据的学习方式

1、基于手工特征的方式

①用图的统计特征（节点的度等）作为结构信息
② $concat(\vec v_{结构信息},\vec v_{属性信息})$
③送到下游进行任务学习

问题：结构信息是人为定义的。

2、基于随机游走（Random Walk）的方式

①使用随机游走的方法将节点的结构信息映射到一个新的特征向量空间中
② $concat(\vec v_{结构信息},\vec v_{属性信息})$
③送到下游进行任务学习

问题：表示学习和任务学习是分离的，并不高效。

3、基于GCN的方式

对于结构信息和属性信息的学习体现在： $\tilde L_{sym}XW$ 。

① $X W$ 对属性信息进行仿射变换
② $\tilde L_{sym}(XW)$ 聚合邻居节点，对结构信息进行编码
③进行任务学习

优点：
①对表示学习和任务学习一起进行端到端优化，具有更好的适应性。
②结构信息和属性信息的学习是同时进行的，二者之间有很好的互补关系。

GCN可以看作Weisfeiler-Lehman算法的一种变形。
《什么是Weisfeiler-Lehman(WL)算法和WL Test？》

6.3 GCN是一个低通滤波器

GCN的损失函数中一般不会添加正则项。
$\tilde L_{sym}=\tilde D^{-\frac{1}{2}}\tilde A\tilde D^{-\frac{1}{2}}=I-\tilde L_s=V(1-\tilde \Lambda)V^T= \\[2ex] V \begin{bmatrix} 1-\tilde \lambda_1& & \\[2ex] & \ddots& \\[2ex] & &1-\tilde \lambda_N \end{bmatrix} V^T$
其中 $\tilde L_s=\tilde D^{-\frac{1}{2}}L\tilde D^{-\frac{1}{2}}$ ，频率响应函数可以定义为：
$p(\lambda)=1-\tilde \lambda_i\in (-1,1]$
如果将信号矩阵 $X$ 不断左乘 $K$ 次 $\tilde L_{sym}$ ，其频率响应函数就可以定义为：
$p(\lambda)=(1-\tilde \lambda_i)^k$
随着 $K$ 的增加，在低频段上的缩放效果更强，因此是一种低通滤波器。
为了突出低通特性、减少参数，还可以将多层GCN退化为，
$Y=\sigma(\tilde L_{sym}^KXW)$