CS224W2.1 Traditional Feature-based Method-Node

目录

Traditional ML Pipline

Node-level Tasks and Features

Node Degree 

Node centrality

Engienvector centrality

Betweenness centrality

 Closeness centrality

 Clustering coefficient

 graphlets

 总结


Traditional ML Pipline

  • 这里的features包括两种类型:结构(structural)特征、描述节点的属性(attribute)和properities特征

        节点有一定附加属性,也想创造其他描述,例如节点怎么位于网络的其他部分,它的局部网络结构是什么,节点的邻域是什么,以及描述整个网络结构的features。可以之后将这些特征输入模型中做出预测。

  • Traditional ML Pipeline:首先获取nodes、links、graph的特征向量;然后训练一个ML model;最后在新的数据上(新的node link graph的特征向量)应用model,做出预测。Traditional ML Pipeline使用手工设计的特征。

在图上使用有效的特征是实现好性能的关键。在本节课中概述传统的特征为了:节点、边、图的预测。为了简单,只考虑无向图。

  • 图中ML的goal:为一系列感兴趣的对象(nodes,edges,sets of nodes,graphs)做预测。

Node-level Tasks and Features

  • 目标:描绘一个节点在网络中的结构和位置。

Node Degree 

  • 节点v的度数k_{v}是节点v的邻居节点数(与v相连的边数)
  • 缺陷:将所有邻居节点同等对待,无法捕捉邻居节点的重要性。(如果几个节点的度数相同,则特征向量相同,则模型对它们做出的预测相同。没办法区分它们)

Node centrality

1.节点中心性可以考虑图中节点的重要性。

Engienvector centrality

如果节点v被重要的nodes包围u\in N(v),则节点v是重要的(我的邻居都重要,那我应该也重要)。

由于左式是递归的,我们如何求解呢?

c_{max}对应着\lambda _{max},即最大特征值对应的特征向量,\lambda _{max}总是正值且是唯一的

Betweenness centrality

如果一个节点在许多其他成对节点的最短路径上,那么节点重要。(如果一个节点是重要的连接器交通枢纽,那很重要)

 Closeness centrality

值越大越好

如果一个节点有到所有其他节点的最短路径,那么这个节点是重要的。

 Clustering coefficient

聚类系数用来评价节点周围邻居节点的连接程度

e_{v}=邻居节点真实存在边数➗最多可能存在边数

 观察到聚类系数计算的是ego-network中三角形的数量(在社交网络中我的朋友的朋友也可能是我的朋友,社交网络会随着三角形的闭合而发展)

 graphlets

那能否对三角形进行扩展,一般化为计算给定节点附近预先指定的子图的数量——graphlets,将仅仅对三角形的计数扩展到任意结构的子图。

graphlets:rooted(基于给定节点)连通的异构子图与motifs区分

 引入GDV:计算一个节点参与的小图的数量

 GDV——是一个根植于给定节点的子图的数量向量

因为graphlets是诱导子图( induced subgraph 节点的所有连接都要包含在内),所以节点在位置c不行,另两个节点必须要连接。

 

GDV提供了一种测量节点局部网络拓扑的方法,通过比较两个节点的GDV提供了一种比node degree和聚类系数更细节的测量局部拓扑相似性的方法。

 总结

node features可以分为:

  1. Importance-based features:捕获节点在图中的重要性
    1.  node degree:只计算了节点邻居节点的数量
    2. Node centrality:可以区别对待邻居节点Models importance of neighboring nodes
  2. Structure-based features:捕获节点局部邻域的拓扑结构
    1.  node degree:只计算了节点邻居节点的数量
    2. 聚类系数:用来评价节点周围邻居节点的连接程度
    3. GDV:计数不同的graphlets的数量

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值