GNN各阶段执行时间实验【Citeseer、Pubmed、Reddit、OGB数据集】

GNN各阶段执行时间实验【Citeseer、Pubmed、Reddit、OGB数据集】

数据集

包括Citeseer、Pubmed、Reddit、OGB数据集的说明、数据集的划分、各数据集的介绍。

数据集 节点 特征(x) 标签(y)
Citeseer 1 3327 4732 3703 6
Pubmed 1 19717 44338 500 3
Reddit 1 232965 11606919 602 41
ogbn-arxiv 1 169343 1166243 128 40
ogbn-products 1 2449029 61859140 100 47
数据集划分(数量) 训练集 验证集 测试集
Citeseer 120 500 1000
Pubmed 60 500 1000
Reddit 153431 23831 55703
ogbn-arxiv 90941 29799 48603
ogbn-products 196615 39323 2213091

Citeseer、Pubmed

目前有三个流行的引文网络「小数据集」:Cora、Citeseer和Pubmed。这些benchmark由Kipf和Welling在GCN模型中推出。

我的博客:节点分类任务中的引文网络benchmark

Reddit

Reddit是一个大型的在线讨论论坛,我们使用Reddit帖子构建了一个图数据集。节点代表帖子,边代表同一个用户对这两个帖子都发表了评论。这个数据集总共包含232965个节点,平均度为492。

数据集下载地址:https://data.dgl.ai/dataset/reddit.zip

OGB数据集

在这里插入图片描述
在这里插入图片描述

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值