异质图神经网络（HGNN）常用数据集信息统计（持续更新ing...）

诸神缄默不语

已于 2022-12-25 11:28:02 修改

阅读量4.7k

点赞数 8

分类专栏：人工智能学习笔记文章标签：图论 GNN HGNN 异质图数据集

于 2022-09-27 13:42:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PolarisRisingWar/article/details/126980733

版权

人工智能学习笔记专栏收录该内容

267 篇文章

订阅专栏

本文汇总了多种常用于异质图神经网络研究的数据集，包括它们的任务类型及来源，涵盖了学术网络分析、电影分类等多个应用场景，并提供了数据集的获取途径。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

诸神缄默不语-个人CSDN博文目录

最近更新时间：2022.12.25
最早更新时间：2022.9.27

文章目录

1. 整体介绍
2. ogbn-mag
3. AMiner (metapath2vec)
4. AMinerNetwork
5. DBIS
6. DBLP (MAGNN)
7. IMDB (MAGNN)
8. IMDB (Simple-HGN)
9. LastFM
10. MovieLens (PyG)
11. ACM
12. Freebase
13. ogbl-biokg

1. 整体介绍

本文统计各论文中常用的异质图数据集信息。
整体表格我做了个石墨文档，但是还没整理好，以后再公开发布吧。

2. ogbn-mag

任务：节点分类，预测paper节点所属的venue（会议或期刊）（共有349类）
Leaderboard：https://ogb.stanford.edu/docs/leader_nodeprop/#ogbn-mag

可通过PyG直接加载。

3. AMiner (metapath2vec)

任务：节点分类，预测venue或author所属的类别
数据来自Re31：读论文 metapath2vec: Scalable Representation Learning for Heterogeneous Networks一文，最初出自ArnetMiner: Extraction and Mining of Academic Social Networks一文。

可通过PyG直接加载。

4. AMinerNetwork

数据来自https://www.aminer.org/aminernetwork（论文也是ArnetMiner: Extraction and Mining of Academic Social Networks），在A multilayered approach for link prediction in heterogeneous complex networks一文中被用作链路预测任务（但是在这篇文章里叫DBLP，是不是很无语）。

5. DBIS

任务：计算节点相似度
数据来自Re31：读论文 metapath2vec: Scalable Representation Learning for Heterogeneous Networks一文，最初出自Pathsim: Meta path-based top-k similarity search in heterogeneous information networks一文。

不便使用dropbox的读者如需下载数据，可在该GitHub项目README文件中展示的百度网盘链接里下载：https://github.com/PolarisRisingWar/HGNN_Collection
加载方式可参考我写的代码：https://github.com/PolarisRisingWar/HGNN_Collection/blob/master/load_data/dbis_pyg.py

6. DBLP (MAGNN)

任务：节点分类，预测author所属的research areas（共有4类）
数据来自MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding一文，出自Graph-based Consensus Maximization among Multiple Supervised and Unsupervised Models和Graph regularized transductive classification on heterogeneous information networks。

可通过PyG直接加载。

7. IMDB (MAGNN)

任务：节点分类，预测movie所属的category（共有3类）
数据来自MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding一文。

可通过PyG直接加载。
（和下面的IMDB (Simple-HGN)用的是同一套原始数据集）

8. IMDB (Simple-HGN)

任务：节点分类，预测movie标签（共有5类）
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks

9. LastFM

任务：链路预测（user-to-artist）
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks，出自HetRec 2011

可通过PyG直接加载。

10. MovieLens (PyG)

（我在石墨文档中的统计信息是通过2022年9月下载的数据计算得到的）
原始数据是https://files.grouplens.org/datasets/movielens/ml-latest-small.zip。
可通过PyG直接加载。

11. ACM

任务：节点分类（paper，共3类）
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks，出自Heterogeneous graph attention network

12. Freebase

任务：节点分类（book，共7类）
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks，出自Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark。

13. ogbl-biokg

任务：链路预测
leaderboard：https://ogb.stanford.edu/docs/leader_linkprop/#ogbl-biokg

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

诸神缄默不语 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。