GNN(图神经网络)的相关研究越来越热,也已经有很多非常成熟的GNN算法成功落地到工业界,而国内的百度就是在这一方面是走在前列的。不仅有顶会文章,刷榜的模型,还有各种落地的场景,所以这个训练营的含金量绝对不是问题。
正如我们在数据结构课程中会学习的图一样,图是由一些边和节点组成的数据结构。以及之前学过的深度优先和广度优先算法在GNN中也会有所涉及。
图的基本表示方法
图 G=(V, E) 构成要素:
节点(verticle):V=1,…,n;
边:E⊆V×V;
边 (i,j) ∈ E 连接了节点 i 和 j
i 和 j 被称为相邻节点(neighbor)
节点的度(degree):指相邻节点的数量。
图是完备的(complete):所有节点都具备所有可能的连接方式。
从i到j的路径(path):从i到达j的边的序列,路径的长度(length)等于所经过的边的数量。
图的直径(diameter):连接任意两个节点的所有最短路径中最长路径的长度。
测地路径(geodesic path):两个节点之间的最短路径。
当然还有一些其他概念,这里不一一介绍,毕竟这门课的重点是GNN。
话不多说,上代码
!pip install pgl
import pgl
from pgl import graph # 导入 PGL 中的图模块
import paddle.fluid as fluid # 导入飞桨框架
import numpy as np
def build_graph():
# 定义图中的节点数目,我们使用数字来表示图中的每个节点
num_nodes = 10
# 定义图中的边集
edge_list = [(2, 0), (2, 1), (3, 1),(4, 0), (5, 0),
(6, 0), (6, 4), (6, 5), (7, 0), (7, 1),
(7, 2), (7, 3), (8, 0), (9, 7)]
# 随机初始化节点特征,特征维度为 d
d = 16
feature = np.random.randn(num_nodes, d).astype("float32")
# 随机地为每条边赋值一个权重
edge_feature = np.random.randn(len(edge_list), 1).astype("float32")
# 创建图对象,最多四个输入
g = graph.Graph(num_nodes = num_nodes,
edges = edge_list,
node_feat = {'feature':feature},
edge_feat ={'edge_feature': edge_feature})
return g
g = build_graph()
pgl是百度的图学习框架,在AIstudio没有内置,每次运行需要重新安装一次。
上面的代码就定义了一个图。
chrome-extension://bocbaocobfecmglnmeaeppambideimao/pdf/viewer.html?file=https%3A%2F%2Fbaidu-pgl.gz.bcebos.com%2Fpgl-course%2Flesson_3.pdf
这个链接是课程PPT的PDF版本,我觉得老师讲的非常好
所有课程视频和PPT都可以在https://github.com/PaddlePaddle/PGL/tree/main/course这个链接里找到
具体代码可以在AIstudio官网找到,欢迎加入课程和我们一起学习。
课程链接https://aistudio.baidu.com/aistudio/education/group/info/1956