异质图神经网络(HGNN)常用数据集信息统计(持续更新ing...)

诸神缄默不语-个人CSDN博文目录

最近更新时间:2022.12.25
最早更新时间:2022.9.27

1. 整体介绍

本文统计各论文中常用的异质图数据集信息。
整体表格我做了个石墨文档,但是还没整理好,以后再公开发布吧。

2. ogbn-mag

任务:节点分类,预测paper节点所属的venue(会议或期刊)(共有349类)
Leaderboard:https://ogb.stanford.edu/docs/leader_nodeprop/#ogbn-mag

可通过PyG直接加载。

3. AMiner (metapath2vec)

任务:节点分类,预测venue或author所属的类别
数据来自Re31:读论文 metapath2vec: Scalable Representation Learning for Heterogeneous Networks一文,最初出自ArnetMiner: Extraction and Mining of Academic Social Networks一文。

可通过PyG直接加载。

4. AMinerNetwork

数据来自https://www.aminer.org/aminernetwork(论文也是ArnetMiner: Extraction and Mining of Academic Social Networks),在A multilayered approach for link prediction in heterogeneous complex networks一文中被用作链路预测任务(但是在这篇文章里叫DBLP,是不是很无语)。

5. DBIS

任务:计算节点相似度
数据来自Re31:读论文 metapath2vec: Scalable Representation Learning for Heterogeneous Networks一文,最初出自Pathsim: Meta path-based top-k similarity search in heterogeneous information networks一文。

不便使用dropbox的读者如需下载数据,可在该GitHub项目README文件中展示的百度网盘链接里下载:https://github.com/PolarisRisingWar/HGNN_Collection
加载方式可参考我写的代码:https://github.com/PolarisRisingWar/HGNN_Collection/blob/master/load_data/dbis_pyg.py

6. DBLP (MAGNN)

任务:节点分类,预测author所属的research areas(共有4类)
数据来自MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding一文,出自Graph-based Consensus Maximization among Multiple Supervised and Unsupervised ModelsGraph regularized transductive classification on heterogeneous information networks

可通过PyG直接加载。

7. IMDB (MAGNN)

任务:节点分类,预测movie所属的category(共有3类)
数据来自MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding一文。

可通过PyG直接加载。
(和下面的IMDB (Simple-HGN)用的是同一套原始数据集)

8. IMDB (Simple-HGN)

任务:节点分类,预测movie标签(共有5类)
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks

9. LastFM

任务:链路预测(user-to-artist)
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks,出自HetRec 2011

可通过PyG直接加载。

10. MovieLens (PyG)

(我在石墨文档中的统计信息是通过2022年9月下载的数据计算得到的)
原始数据是https://files.grouplens.org/datasets/movielens/ml-latest-small.zip
可通过PyG直接加载。

11. ACM

任务:节点分类(paper,共3类)
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks,出自Heterogeneous graph attention network

12. Freebase

任务:节点分类(book,共7类)
数据来自Are We Really Making Much Progress? Revisiting, Benchmarking, and Refining Heterogeneous Graph Neural Networks,出自Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark

13. ogbl-biokg

任务:链路预测
leaderboard:https://ogb.stanford.edu/docs/leader_linkprop/#ogbl-biokg

  • 6
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
并查集是一种用于解决集合合并与查询问题的数据结构。在食物链问题中,我们可以使用并查集来判断给定的K句话中有多少句是假话。 首先,我们需要创建一个并查集,其中每个动物都是一个节点。初始时,每个节点都是独立的集合。 然后,我们按照给定的K句话进行处理。对于每一句话,我们需要判断它是真话还是假话。 如果是第一种说法"1 X Y",表示X和Y是同类。我们可以通过将X和Y所在的集合合并来实现。即将X所在的集合的根节点指向Y所在的集合的根节点,或者将Y所在的集合的根节点指向X所在的集合的根节点。 如果是第二种说法"2 X Y",表示X吃Y。我们需要判断X和Y是否属于同一类。如果它们属于同一类,那么这句话就是假话。否则,这句话是真话。 最后,我们统计假话的总数即可。 以下是一个示例代码,演示了如何使用并查集解决食物链问题: ```python class UnionFind: def __init__(self, n): self.parent = list(range(n)) self.rank = [0] * n def find(self, x): if self.parent[x] != x: self.parent[x] = self.find(self.parent[x]) return self.parent[x] def union(self, x, y): root_x = self.find(x) root_y = self.find(y) if root_x == root_y: return if self.rank[root_x] < self.rank[root_y]: self.parent[root_x] = root_y elif self.rank[root_x] > self.rank[root_y]: self.parent[root_y] = root_x else: self.parent[root_y] = root_x self.rank[root_x] += 1 def count_false_statements(N, K, statements): uf = UnionFind(N+1) false_count = 0 for statement in statements: type, X, Y = statement if X > N or Y > N: false_count += 1 continue if type == 1: if uf.find(X) == uf.find(Y+N) or uf.find(X+N) == uf.find(Y): false_count += 1 else: uf.union(X, Y) uf.union(X+N, Y+N) uf.union(X+2*N, Y+2*N) elif type == 2: if uf.find(X) == uf.find(Y) or uf.find(X+N) == uf.find(Y): false_count += 1 else: uf.union(X, Y+N) uf.union(X+N, Y+2*N) uf.union(X+2*N, Y) return false_count N = 5 K = 7 statements = [(1, 1, 2), (2, 1, 3), (1, 2, 3), (2, 2, 4), (1, 4, 1), (1, 4, 3), (2, 4, 3)] false_count = count_false_statements(N, K, statements) print(false_count) # 输出:3 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诸神缄默不语

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值