GraphSAGE模型实验记录【Cora、Citeseer、Pubmed】

最新推荐文章于 2025-02-28 17:53:14 发布

智慧的旋风

最新推荐文章于 2025-02-28 17:53:14 发布

阅读量4k

点赞数 3

分类专栏： GNN实验文章标签：深度学习 GraphSAGE 图神经网络 GNN GCN

本文链接：https://blog.csdn.net/weixin_41650348/article/details/112461238

版权

这篇博客详细记录了使用GraphSAGE模型在Cora、Citeseer、Pubmed数据集上的实验过程，包括数据集划分、代码实现、实验环境、超参数设置及实验结果分析。博主通过调整数据集划分和使用PyG库，对比了不同层数SageGCN的效果，并探讨了数据集孤立节点问题对模型的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据集	#图	#节点	#边	#特征	#标签(y)
Cora	1	2708	5429	1433	7
Citeseer	1	3327	4732	3703	6
Pubmed	1	19717	44338	500	3

数据集划分（数量）	训练集	验证集	测试集
Cora	140	500	1000
Citeseer	120	500	1015
Pubmed	60	500	1000

参考：https://github.com/FighterLYL/GraphNeuralNetwork/tree/master/chapter7。
使用监督学习的方法，增加了Citeseer和Pubmed数据集，并对其代码进行了重构和调试，排除了一些小bug，增加了详细的注释。
完善后的代码：https://github.com/ytchx1999/GraphSAGE-Cora-Citeseer-Pubmed。

其实本地用mac的CPU跑也蛮快的。。
但是还是用GPU（最开始是一块2080Ti，后面用的Tesla T4）会更快一点，毕竟time is money！

在这里插入图片描述

BATCH_SIZE = 16  # 批处理大小
EPOCHS = 10
NUM_BATCH_PER_EPOCH = 20  # 每个epoch循环的批次数
LEARNING_RATE = 「0.1，0.01」  # 学习率，每5个epoch x0.1

在这里插入图片描述

GraphSage(
  in_features=【输入的特征维度】, num_neighbors_list=[10, 10]
  (