同济子豪兄--传统图机器学习的特征工程-节点【斯坦福CS224W】

最新推荐文章于 2025-05-15 07:55:33 发布

学心理学的猫

最新推荐文章于 2025-05-15 07:55:33 发布

阅读量374

点赞数 3

分类专栏： GNN 文章标签：机器学习人工智能深度学习

本文链接：https://blog.csdn.net/m0_51118873/article/details/143079766

版权

GNN 专栏收录该内容

5 篇文章

订阅专栏

引言：机器是看不懂图的节点、连接之类的东西，所以将这些东西以矩阵和向量的形式进行改写，读入到模型中。

节点的属性特征：例如一个节点可以包括年龄、性别、收入等这些都可以称为属性特征。

节点的连接特征：表述的是一个节点和整个图的其他节点之间的关系。

半监督学习（Semi-Supervised Learning，简称SSL）：是一种机器学习范式，它介于监督学习和无监督学习之间。在监督学习中，模型的训练依赖于大量的标记数据，而在无监督学习中，数据通常没有标记。半监督学习则结合了这两者的特点，使用少量的标记数据和大量的未标记数据来进行学习。

图中给出少量绿色和红色节点然后预测整张图结构的其他未知节点情况。

下图根据NodeDegree（节点度数）来判断点的情况，A和G都是度数为1，但是A是院士的关门弟子而G是一个小老板的手下的土博，两者是明显不对等的，所以说两者的质量是完全不同的。所以只看NodeDegree是不够全面的。

那么怎样避免上面只看数量（度数）不看质量的情况呢？提出了一下方案。

Eigenvector centrality（特征向量中心性）：是一种衡量网络中节点重要性的方法。它的核心思想是：如果一个节点连接到许多重要的节点，那么这个节点本身也变得更加重要。这种方法不仅考虑了节点的连接数（即度），还考虑了这些连接的节点的重要性。因此，Eigenvector centrality可以捕捉到网络中的间接连接和节点的全局影响力。

理解为：若一个节点周围的节点很重要则这个节点很重要。

介数中心性（Betweenness Centrality）：是网络分析中一个重要的概念，用于衡量网络中节点的重要性。它基于一个节点在所有节点对之间的最短路径上出现的次数来定义。如果一个节点在许多最短路径上充当“桥梁”或“中介”，那么这个节点就具有高介数中心性，这表明它在网络中的信息流通或资源流动中扮演着关键角色。

理解为：一个节点是否处在交通咽喉和必经之地（例如武汉的位置）。