[图神经网络]PyTorch简单实现一个GCN

Pytorch自带一个PyG的图神经网络库,和构建卷积神经网络类似。不同于卷积神经网络仅需重构__init__( )forward( )两个函数,PyTorch必须额外重构propagate( )message( )函数。

一、环境构建

        ①安装torch_geometric包。

pip install torch_geometric

        ②导入相关库

import torch
import torch.nn.functional as F
import torch.nn as nn
import torch_geometric.nn as pyg_nn
from torch_geometric.datasets import Planetoid

二、PyG图学习架构

        构建方法:首先继承MessagePassing类,接下来重写构造函数和以下三个方法:

message()      #构建消息传递
aggregate()    #将消息聚合到目标节点
update()       #更新消息节点

        1.构造函数

def __init__(self, aggr: Optional[str] = "add",
             flow: str = "source_to_target", node_dim: int = -2,
             decomposed_layers: int = 1):
参数内容
aggr消息聚合的方式,常见的方法:addmeanminmax
flow

消息传播的方向,source_to_target--从源节点到目标节点

                             target_to_source--从目标节点到源节点

node_dim传播的维度

        2.propagate函数

                该函数为消息传播的启动函数,调用此函数后会依次执行:messageaggregateupdate来完成消息的传递、聚合、更新

                该函数声明如下:

propagate(self, edge_index: Adj, size: Size = None, **kwargs)
参数说明
edge_index边索引
size邻接矩阵的尺寸,若为None则表示方阵
**kwargs额外参数

        3.message函数

                用于构建节点消息,传递给propagatetensor可以映射到中心节点和邻居节点,仅需在相应的变量名后加上_i(中心节点)或_j(邻居节点)即可。

self.propagate(edge_index, x=x):
    pass

def message(self, x_i, x_j, edge_index_i):
    pass
x_i中心节点构成的特征向量组成的矩阵
x_j邻居节点构成的特征向量组成的矩阵
edge_index_i中心节点的索引

        4.aggregate函数

                消息聚合函数,用以聚合来自邻居的消息,常见的方法有add、sum、mean、max,可以通过super().__init__()中的参数aggr来设定

        5.update函数

                用于更新节点的消息

三、GCN图卷积网络

        GCN网络的原理可见:图卷积神经网络--GCN

        需要注意 torch_scatter无法使用pip install加载可以参见 torch_scatter安装

        1.加载数据集

from torch_geometric.datasets import Planetoid

dataset = Planetoid(root='Cora', name='Cora')

                Cora数据集是一个根据科学论文之间相互引用关系构建的图(Graph)数据集合,论文合计7类,共2708篇论文(2708个节点),10556条边。

        2.定义GCN层

class GCNConv(MessagePassing):
    def __init__(self, in_channels, out_channels, add_self_loops=True, bias=True):
        super(GCNConv, self).__init__()
        self.add_self_loops = add_self_loops
        self.edge_index = None
        self.linear = pyg_nn.dense.linear.Linear(in_channels, out_channels, weight_initializer='glorot')
        
        
        if bias:
            self.bias = nn.Parameter(torch.Tensor(out_channels, 1))
            self.bias = pyg_nn.inits.glorot(self.bias)
        else:
            self.register_parameter('bias', None)
    
    # 1.消息传递
    def message(self, x, edge_index):
        # 1.对所有节点进行新的空间映射
        x = self.linear(x) # [num_nodes, feature_size]
        # 2.添加偏置
        if self.bias != None:
            x += self.bias.flatten()
        # 3.返回source、target信息,对应边的起点和终点
        row, col = edge_index # [E]
        # 4.获得度矩阵
        deg = degree(col, x.shape[0], x.dtype) # [num_nodes]
        # 5.度矩阵归一化
        deg_inv_sqrt = deg.pow(-0.5) # [num_nodes]
        # 6.计算sqrt(deg(i)) * sqrt(deg(j))
        norm = deg_inv_sqrt[row] * deg_inv_sqrt[col] # [num_nodes]
        # 7.返回所有边的映射
        x_j = x[row] # [E, feature_size]
        # 8.计算归一化后的节点特征
        x_j = norm.view(-1, 1) * x_j # [E, feature_size]
        
        return x_j
    
    # 2.消息聚合
    def aggregate(self, x_j, edge_index):
        # 1.返回source、target信息,对应边的起点和终点
        row, col = edge_index # [E]
        # 2.聚合邻居特征
        aggr_out = scatter(x_j, row, dim=0, reduce='sum') # [num_nodes, feature_size]
        
        return aggr_out
    
    # 3.节点更新
    def update(self, aggr_out):
        # 对于GCN没有这个阶段,所以直接返回
        return aggr_out
    
    def forward(self, x, edge_index):
        # 2.添加自环信息,考虑自身信息
        if self.add_self_loops:
            edge_index, _ = add_self_loops(edge_index, num_nodes=x.shape[0]) # [2, E]
        
        return self.propagate(edge_index, x=x)

        3.定义GCN网络

class GCN(nn.Module):
    def __init__(self, num_node_features, num_classes):
        super(GCN, self).__init__()
        self.conv1 = GCNConv(num_node_features, 16)
        self.conv2 = GCNConv(16, num_classes)
        
    def forward(self, data):
        x, edge_index = data.x, data.edge_index
        
        x = self.conv1(x, edge_index)
        x = F.relu(x)
        x = F.dropout(x, training=self.training)
        x = self.conv2(x, edge_index)
        
        return F.log_softmax(x, dim=1)

        4.模型调用

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') # 设备
epochs = 200 # 学习轮数
lr = 0.0003 # 学习率
num_node_features = dataset.num_node_features # 每个节点的特征数
num_classes = dataset.num_classes # 每个节点的类别数
data = dataset[0].to(device) # Cora的一张图

# 4.定义模型
model = GCN(num_node_features, num_classes).to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=lr) # 优化器
loss_function = nn.NLLLoss() # 损失函数

# 训练模式
model.train()

for epoch in range(epochs):
    optimizer.zero_grad()
    pred = model(data)
    
    loss = loss_function(pred[data.train_mask], data.y[data.train_mask]) # 损失
    correct_count_train = pred.argmax(axis=1)[data.train_mask].eq(data.y[data.train_mask]).sum().item() # epoch正确分类数目
    acc_train = correct_count_train / data.train_mask.sum().item() # epoch训练精度
    
    loss.backward()
    optimizer.step()
    
    if epoch % 20 == 0:
        print("【EPOCH: 】%s" % str(epoch + 1))
        print('训练损失为:{:.4f}'.format(loss.item()), '训练精度为:{:.4f}'.format(acc_train))

print('【Finished Training!】')

# 模型验证
model.eval()
pred = model(data)

# 训练集(使用了掩码)
correct_count_train = pred.argmax(axis=1)[data.train_mask].eq(data.y[data.train_mask]).sum().item()
acc_train = correct_count_train / data.train_mask.sum().item()
loss_train = loss_function(pred[data.train_mask], data.y[data.train_mask]).item()

# 测试集
correct_count_test = pred.argmax(axis=1)[data.test_mask].eq(data.y[data.test_mask]).sum().item()
acc_test = correct_count_test / data.test_mask.sum().item()
loss_test = loss_function(pred[data.test_mask], data.y[data.test_mask]).item()

print('Train Accuracy: {:.4f}'.format(acc_train), 'Train Loss: {:.4f}'.format(loss_train))
print('Test  Accuracy: {:.4f}'.format(acc_test), 'Test  Loss: {:.4f}'.format(loss_test))

  • 4
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
基于Pytorch框架手动构建GCN卷积神经网络python源码+详细注释+实验报告.zip 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载!欢迎交流学习!不清楚的可以私信问我! 基于Pytorch框架手动构建GCN卷积神经网络python源码+详细注释+实验报告.zip 实验要求 使用 pytorch 或者 tensorflow 的相关神经网络库,编写卷积神经网络模型 (GCN),并在相应的结构 数据集上完成节点分类和链路预测任务,最后分析自环、层数、DropEdge 、PairNorm 、激活函数等 因素对模型的分类和预测性能的影响 。 实验步骤 1. 网络框架:要求选择 pytorch 或 tensorflow 其中之一,依据官方网站的指引安装包。(如果前面 实验已经安装过,则这个可以跳过) 2. 数据集:本次实验使用的数据包含两个常用的结构数据集:Cora 、Citeseer 。下面分别进行介绍。 数据预处理:你需要通过pytorch或tensorflow所提供的标准数据接口,将原始数据处理为方便模 型训练脚本所使用的数据结构,如torch.utils.data.Dataset/或者使用dgl库进行数据的处理等。 由于这两个数据集是非常常见的公开数据集,你可以参考一些公开代码片段 模型搭建:搭建GCN模型,这一步可以参考网络上公开的源码,但不能直接使用封装过的库(即不 得使用已经封装好的GCN进行构建,请自行实现GCN网络的搭建,如GraphConv需要自己手动实 现,不得使用已经封装好的)。 提示:不能直接调用PyG等网络库,因为本实验的主要目的就是希望大家通过编码熟悉网络的结构和实现 细节。但是允许并鼓励大家多去看看这些库以及其他公开实现的源码,直接改进自己代码是可以的 5. 模型训练:将生成的训练集输入搭建好的模型进行前向的 loss 计算和反向的梯度传播,从而训练 模型,同时也建议使用网络框架封装的 optimizer 完成参数更新过程。训练过程中记录模型在训练 集和验证集上的损失,并绘可视化。 6. 节点分类:在两个数据集上按照节点分类任务的需求自行划分训练集、验证集、测试集,并用搭建 好的GCN模型进行节点分类。 7. 链路预测:在两个数据集上按照链路预测任务的需求自行划分训练集、验证集、测试集,并用搭建 好的GCN模型进行链路预测。 8. 调参分析:将训练好的模型在验证集上进行测试,以 Top 1 Accuracy(ACC) 作为节点分类指标, AUC(Area Under the Curve)作为链路预测任务的指标。然后,对自环、层数、DropEdge 、 PairNorm 、激活函数进行调整,再重新训练、测试,并分析对模型性能的影响。 9. 测试性能:选择你认为最合适的(例如,在验证集上表现最好的)一组超参数,重新训练模型,并 在测试集上测试(注意,这理应是你的实验中唯一一次在测试集上的测试),并记录测试的结果 (节点分类:Top1 ACC, 链路预测:AUC)
PyTorch实现GCN的步骤如下: 1. 导入相关库:首先需要导入PyTorch及其相关的库,如torch、torch.nn.functional、torch.nn和torch_geometric.nn等。\[1\] 2. 构建GCN学习架构:可以使用自己实现GCN模型,也可以使用PyG库中的GCNConv层。如果选择自己实现GCN模型,需要导入numpy、torch和torch.nn等库,并根据GCN的原理进行实现。如果选择使用PyG库,可以直接调用GCNConv层。\[2\] 3. 加载数据集:可以使用PyG库中的内置数据集,如Planetoid中的Cora数据集。加载Cora数据集时,需要手动实现获取该对应的邻接矩阵。可以使用scipy.sparse库中的coo_matrix函数将边的索引和权重转换为邻接矩阵的稀疏表示,然后将其转换为稠密矩阵。\[3\] 4. 构建度矩阵D:可以使用邻接矩阵计算度矩阵D,度矩阵是一个对角矩阵,对角线上的元素表示每个节点的度数。可以使用torch.diag函数将度矩阵的对角线设置为每个节点的度数。\[3\] 以上是PyTorch实现GCN的基本步骤,具体的实现细节可以根据需要进行调整和优化。 #### 引用[.reference_title] - *1* [[神经网络]PyTorch简单实现一个GCN](https://blog.csdn.net/weixin_37878740/article/details/130114750)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [Pytorch实现GCN(基于PyTorch实现)](https://blog.csdn.net/m0_47256162/article/details/128739905)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值