本文为pyg官网的中文翻译(官方原版链接 https://pytorch-geometric.readthedocs.io/en/latest/),并加入了一些其他网上大佬和自己的理解。如有翻译理解不当之处还请各位多多指出,非常感谢!
2.1举个大栗子,举很多栗子,举各种各样的栗子
pyg主要提供以下主要功能:
- 图的数据处理
- 通用基准数据集
- 小批量
- 数据转换
- 图的学习方法
- 练习
2.1.1 图的数据处理
图用于对对象(节点)之间的成对关系(边)进行建模。pyg中的单个图由torch_geometry.data.Data实例描述。Data,默认情况下包含以下属性:
- data.x :表示节点特征矩阵,形状为[num_nodes(节点总数),num_node_features(节点特征)]
- data.edge_index :图用COO格式进行连接,其形状为[num_edges(总的边个数),num_edge_features(边的特征)][2,num_edges],类别为torch.long
- data.edge_attr :边的特征矩阵,形状为[num_edges,num_edge_features]
- data.y :待训练的目标可以是任意形状。节点级目标的形式为[num_nodes,* ],图级的目标形式为[1,*]
- data.pos :节点位置矩阵,形状为[num_nodes(节点总数),num_dimensions(节点维度)]
这些属性都不是必需的。此外Data对象甚至可以在增添一些属性。例如,3D图:形状为[3,num_faces],类型为torch.long的张量。
栗子1
已知,一个无权无向图有3个节点4条边,每个节点只包含一个特征:
import torch
from torch_geometric.data import Data
edge_index = torch.tensor([[0,1,1,2],[1,0,2,1]],dtype=torch.long)
x = torch.tensor([[-1],[0],[1]],dtype=torch.float)
data = Data(x=x,edge_index=edge_index)
>>>Data(edge_index=[2,4],x=[3,1])
注意,edge_index,即定义所有边的源节点和目标节点的张量,并不是索引元组的列表。如果你想按照该写法写你的索引,那就应该在传递给数据构造函数之前对它进行转置和调用,举例:
import torch
from torch_geometric.data import Data
edge_index = torch.tensor([[0, 1],
[1, 0],
[1, 2],
[2, 1]], dtype=torch.long)
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)
data = Data(x=x, edge_index=edge_index.t().contiguous())
>>> Data(edge_index=[2, 4], x=[3, 1])
(备注:请移步“pytorch–初识张量与基础函数 https://blog.csdn.net/lkr_2023/article/details/123200296”)
虽然上图只有两条边,但我们需要定义四个索引元组来说明一条边的两个方向。
注 | - |
---|---|
你可以随时打印该图的属性以及形状等信息 | |
最终使用==validate()==命令来检查data最终数据对象是否满足要求: |