图神经网络--图的基本表示和特征工程

本文链接：https://blog.csdn.net/weixin_43557816/article/details/129064143

文章介绍了图的基本表示，包括无向图、有向图、异质图等类型，以及节点连接数、邻接矩阵等概念。在特征工程方面，探讨了节点和连接层面的特征工程在传统机器学习中的应用，如节点分类和链接预测任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

图的基本表示和特征工程

图神经网络

图的基本表示和特征工程
前言
一、图的基本表示
二、传统机器学习（人工特征工程+机器学习）

前言

图是描述大自然的通用语言，图数据自带关联结构。图神经网络是端到端的表示学习，可以自动学习特征，无需人为的特征工程。不同的任务类型：包括Graph层、Node层、Community(subgraph)层、Edge层。图机器学习可以和人工智能各个方向进行结合

一、图的基本表示

1.图的基本表示

Objects：nodes（节点）、vertices（顶点）表示为N
Interactions（关系）：links、edges表示为E
System：network、graph表示为G(N,E)

2.图的类型

无向图：连接是无方向的
有向图：连接是有方向的
异质图：节点和连接都存在不同的类型
二分图（Bipartite Graph）：节点只有两类
展开二分图：将连接了另一类的节点进行分别连接

3.节点连接数

无向图：平均度为 $\overline{k}=\dfrac{1}{N}\sum_{i=1}^{N} k_i$

有向图：平均度为 $\overline{k}=\dfrac{E}{N}$

4.邻接矩阵

无向图：
其邻接矩阵是对称阵， $A_{ij}=A_{ji}$ ，且主对角线元素 $A_{ii}=0$ 。
连接（边）总数： $L=\dfrac{1}{2}\sum_{i=1}^{N} k_i=\dfrac{1}{2}\sum_{ij}^{N}A_{ij}$
有向图：
其邻接矩阵是非对称阵， $A_{ij}\ne A_{ji}$ ，且主对角线元素 $A_{ii}=0$ 。

5.图的连通性

Connected graph（无向图）：如果能满足任意两个节点能到达的图
Disconnected graph（有向图）：不能满足任意两个节点能到达的图
Giant Component：最大连通域
Isolated node：孤立节点
Strongly connected directed graph：有向图中，任意两个节点可以互相到达
Weakly connected directed graph：忽略方向之后，如果任意两个节点能互相到达
Strongly connected compoinents(SCCs)：强连通域
In-component：节点指向SCC
Out-component：节点指出SCC

二、传统机器学习（人工特征工程+机器学习）

1.特征分类

节点属性特征：Weight、Ranking、Type、Sign、多模态特征（图像、视频、文本、音频）
边连接特征

2.传统机器学习

把节点、连接、全图变成D维向量
将D维向量输入到机器学习模型中进行训练
给出一个新的图（节点、连接、全图）和特征，进行预测

3.节点层面的特征工程

主要流程：给出 $G = (V, E)$ ，学习函数 $f:V\rightarrow\mathbb{R}$
半监督节点分类任务：使用已知节点图，预测未知节点的类别
节点特征：Node degree、Node centrality（节点重要度）、Clustering coefficient（聚集系数）、Graphlets（子图模式）