GraphSHA 开源项目使用教程

平依佩Ula

于 2024-09-13 07:17:44 发布

阅读量701

点赞数 17

本文链接：https://blog.csdn.net/gitblog_00012/article/details/142191048

版权

GraphSHA 是一个用于处理类不平衡节点分类问题的开源项目。该项目在 KDD'23 会议上发表，旨在通过合成更难的样本（Harder Samples）来扩大少数类（Minor Classes）的决策边界，从而提高图神经网络（GNN）在类不平衡节点分类任务中的表现。

GraphSHA 的核心思想是通过合成更难的样本，使得少数类的决策边界得到扩展，同时避免这些扩展边界侵入相邻类的子空间。项目中还引入了一个名为 SemiMixup 的模块，用于在扩展少数类边界的同时，阻止信息从少数类传播到相邻类。

GraphSHA 项目已经在以下环境中进行了测试：

请确保按照官方指南安装 PyTorch 和 PyTorch Geometric。

克隆项目仓库：

git clone https://github.com/wenzhilics/GraphSHA.git
cd GraphSHA

以下是一个简单的运行示例，使用 Cora 数据集进行类不平衡节点分类：

python main.py --dataset Cora --data_path dataset/ --imb_ratio 100 --net GCN --gdc ppr

--dataset: 数据集名称，可选值包括 ['Cora', 'CiteSeer', 'PubMed', 'Amazon-Photo', 'Amazon-Computers', 'Coauthor-CS']。
--data_path: 数据集路径，数据集将自动下载到该路径。
--imb_ratio: 不平衡比率。
--net: GNN 骨干网络，可选值包括 ['GCN', 'GAT', 'SAGE']。
--gdc: 获取加权图的方式，可选值包括 ['ppr', 'hk', 'none']。