目录
图的基本表示
- 图的本体设计
- 图的种类(有向、无向、异质、二分、连接带权重)
- 节点连接数
- 图的基本表示-邻接矩阵
- 图的基本表示-连接列表和邻接列表
- 图的连通性
如何定义一张图
图的种类:
无向图和有向图
异质图
邻接矩阵(Adjacency Matrix)
连接列表、邻接列表
其他种类的图
连通性:例子
具有多个分量的网络的邻接矩阵可以写成块对角线形式,因此非零元素被限制在正方形中,所有其他元素都为零:
强连通有向图
▪有一条从每个节点到其他节点的路径,反之亦然(例如,A-B路径和B-A路径)如果我们忽略边缘方向。
弱连通有向图
▪如果我们忽略边缘方向,是连接的。
总结
首先复习了上一个视频,接着了解了图的本体设计,对图有了基本概念。如何学习图的种类(有向、无向、异质、二分、连接带权重)、节点连接数、图的基本表示-邻接矩阵和连接列表、邻接列表。还有图的连通性。
传统图机器学习的特征工程-节点
zihao_course/2-tradition-ml.md at main · TommyZihao/zihao_course · GitHub
传统图机器学习(人工特征工程+机器学习)
图机器学习
目标:
对一组对象进行预测
设计选择:
特征:d维向量
对象:节点,边,节点集,整个图
目标函数:
我们的目标要解决的任务是什么?
节点级任务
目标:描述网络中一个节点的结构和位置:
▪节点度
▪节点中心性
▪聚类系数
▪小图
- 节点𝑣的度𝑘𝑣是节点拥有的边(相邻节点)数。
- 平等地对待所有相邻的节点。
节点度计算相邻的节点,而不捕捉它们的重要性。
节点中心性𝑐𝑣考虑了图中的节点重要,
建模重要性的不同方法:
▪特征向量中心性
▪间隙中心度
▪闭合中心性
▪还有很多其他的方法。
特征向量中心性
特征向量中心性:
如果节点𝑣被重要的相邻节点关联关联关联(𝑢∈𝑁,𝑣)包围,那么节点𝑣就很重要。
我们将节点𝑣的中心性建模为相邻节点中心性的和:
𝜆是归一化常数(它将是A的最大特征值)
▪请注意,上面的方程以递归的方式建模中心性。我们如何解决它?
以矩阵的形式重写递归方程。
𝜆为归一化常量(A的最大特征值)
𝑨:邻接矩阵𝑨𝑢𝑣=1,如果是𝑢∈𝑁(𝑣)
𝒄:中心性向量
𝜆:特征值
我们可以看到中心性𝑐是𝑨的特征向量!
最大的特征值𝜆𝑚𝑎𝑥总是正的和唯一的(根据彭-弗罗比尼乌斯定理)。
与𝜆𝑚𝑎𝑥对应的特征向量C𝑚𝑎𝑥用于中心性。
间隙中心度
间隙中心度:
如果一个节点位于其他节点之间的许多最短路径上,那么它就很重要了。
紧密性中心点
紧密性中心点:
如果一个节点到所有其他节点的最短路径长度都很小,那么它就很重要。
聚类系数(clustering coefficient)
测量𝑣‘𝑠相邻节点的连接程度:
#(𝑘𝑣个相邻节点之间的节点对)在我们下面的例子中,分母是6(4选择2)
目标:描述节点u周围的网络结构
▪图是描述节点𝑢的网络邻域结构的小子图
类比:
- 节点接触的度数#(边)。
- 聚类系数计算节点接触的#(三角形)。
- 图形度向量(GDV):节点的图形基特征
- GDV计数节点触摸的#(图形)
考虑到大小为2-5个节点的小图,我们得到:
73个坐标的矢量是一个节点的签名,描述了节点附近的拓扑结构。
图度向量提供了一个节点的局部网络拓扑的度量:
比较两个节点的向量提供了比节点度或聚类系数更详细的局部拓扑相似性度量。
传统图机器学习的特征工程-连接
传统图机器学习的特征工程-全图
总结:
分别从图的节点、链接和全图层面介绍了图的相关知识,对节点的划分、如何连接、构成有了直观的了解。对传统图相关公式有所学习。