图卷积经典Semi-Supervised Classification with Graph笔记

谭同学KevinTan

已于 2024-01-23 20:33:19 修改

阅读量880

点赞数 22

文章标签：笔记人工智能

于 2024-01-23 20:31:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45047473/article/details/135772291

版权

本文详细介绍了GCN模型在train.py中的调用过程，包括参数定义（如nfeat、nhid、dropout），以及图卷积层的结构、权重初始化和前馈运算。重点阐述了如何从contentfile和citesfile中加载数据，构建图并进行归一化处理。

摘要由CSDN通过智能技术生成

一、模型结构定义

1.1调用位置

train.py中调用模型

1.2传入参数

model.py：

nfeat为底层节点的参数feature的个数
nhid为隐藏层节点个数
nclass最终的分类数
dropout在训练过程中随机关闭神经元的比例，用于防止过拟合

1.3GCN定义

gcl1输入尺寸nfeat，输出尺寸nhid

gcl2输入尺寸nhid，输出尺寸nclass

1.4网络结构

论文公式：

$Z=f(X,A)=\text{softmax}\Big(\hat{A}\text{ReLU}\Big(\hat{A}XW^{(0)}\Big)W^{(1)}\Big).$

其中：A是对称邻接矩阵，由如下构造对称性：

adj = adj + adj.T.multiply(adj.T > adj) - adj.multiply(adj.T > adj)。。

W0是输入层到隐藏层的权重矩阵，W1是隐藏层到输出层的权重矩阵

代码实现：

adj=A是对称邻接矩阵

二、图卷积层

2.1层初始化定义GraphConvolution

in_features:输入特征那的维度

out_features:输出特征的维度

bias:bool型是否使用偏置项

weigt：可学习的权重矩阵

2.2初始化权重reset parameters

weight或bias.data.uniform_(-stdv,stdv):初始化为均匀分布在(-stdv,stdv)范围内的值,

其中stdv是根据权重大小计算的标准差的倒数，用于确定初始化值的范围。

2.3前馈运算forward

论文中是三个矩阵相乘：

input：输入特征矩阵 adj:邻接矩阵

support：输入特征矩阵和权重矩阵的矩阵乘法，XW

output：邻接矩阵和support的稀疏矩阵乘法，实现图卷积，AXW

如果bias=true，则将其加到输出上

三、加载数据

3.1content file

core数据集，7个类别：

       Case_Based
       Genetic_Algorithms
       Neural_Networks
       Probabilistic_Methods
       Reinforcement_Learning
       Rule_Learning
       Theory

<paper_id> <word_attributes>+ <class_label>

第一列：paper_id,第二系列：词汇表中的每个单词是否出现在该论文中，第三：类别标签

3.2cites file

<ID of cited paper> <ID of citing paper>

前面为被引用论文的id，后面为引用前面的论文id

3.3读取数据

3.3.1content file读取：

构建特征矩阵features：第2列到倒数第2列

对标签进行独热编码labels：选取每行的最后一个元素

3.3.2citesd读取

构建图：根据contecontents与cites创建图，算出edges矩阵和adj矩阵

矩阵定义：

3.3.3运算 symmetric adjacency matrix A （无向性）

论文中的计算方式为： $\hat{A}=\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}$ ，

$\tilde{A}=A+I_{N}$ ，IN为单位矩阵,表示：加上自连接的邻接矩阵

$\tilde{D}_{ii}=\sum_{j}\tilde{A}_{ij}$ ，加上自连接后的节点度数

3.3.4 归一化运算 $\hat{A}=\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}$

$Z=f(X,A)=\text{softmax}\Big(\hat{A}\text{ReLU}\Big(\hat{A}XW^{(0)}\Big)W^{(1)}\Big).$

论文中的计算方式为： $\hat{A}=\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}$ ，

$\tilde{A}=A+I_{N}$ ，IN为单位矩阵,表示：加上自连接的邻接矩阵

$\tilde{D}_{ii}=\sum_{j}\tilde{A}_{ij}$ ，加上自连接后的节点度数

为啥要对 $\tilde{A}$ 做归一化？

首先，输入的特征矩阵X 去乘以邻接矩阵A 目的是将节点的邻居特征信息聚合到中心节点

其次，算AX=F矩阵乘法时，度越大的节点，所求的特征矩阵F的特征就很大（比如D节点）。

但是，特征信息并不一定和度成正相关，所以要剔除度的影响，

所以，通过左行右列乘D的逆对A做归一化

（其实就是A*1/D 求平均的感觉）

代码实现：

mx.sum(1) 对矩阵每一行元素求和，邻接矩阵每一行的和是节点的度

np.power(rowsum,-1) 对度取倒数得到归一化因子

r_inv[np.isinf(r_inv)]=0 将任何无穷大的值替换为0，因为有度为0的情况这时除以0导致数值无穷大

r_mat_inv=sp.diags(r_inv) 将归一化因子构建成一个对角矩阵

最后将对角矩阵和原矩阵相乘，进行归一化。

参考Graph Convolution Network图卷积网络（一）训练运行与代码概览_graph convolution layer代码-CSDN博客

谭同学KevinTan

关注

22
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
图卷积经典Semi-Supervised Classification with Graph笔记

train.py中调用模型gcl1输入尺寸nfeat，输出尺寸nhidgcl2输入尺寸nhid，输出尺寸nclassin_features:输入特征那的维度out_features:输出特征的维度bias:bool型是否使用偏置项weigt：可学习的权重矩阵。
复制链接

扫一扫

谭同学KevinTan CSDN认证博客专家 CSDN认证企业博客

码龄5年

2: 原创

203万+: 周排名

22万+: 总排名

1187: 访问

: 等级

53: 积分

22: 粉丝

30: 获赞

1: 评论

27: 收藏

私信

关注

热门文章

最新评论

图卷积经典Semi-Supervised Classification with Graph笔记
CSDN-Ada助手: 很棒的博文！你对图卷积的经典应用做了很好的总结，内容简洁明了。希望你能继续分享更多关于图卷积和半监督分类的知识，或许可以深入探讨一下图卷积在社交网络或推荐系统中的应用，或者介绍一些图神经网络的其他经典模型和算法。另外，除了编程技能，也许可以多了解一些图论和机器学习理论知识，这些都会对你的研究和写作有所帮助。期待你的更多精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
卷积层note
CSDN-Ada助手: 恭喜你开始了博客创作的旅程！阅读了你的博文，对卷积层有了更深入的了解，写得很不错。建议你下一步可以尝试结合实际案例，分享一些自己的实践经验，这样会更有说服力，也更能吸引读者的注意。希望你能继续坚持，不断进步。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

卷积层note

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。