CS224W2.1——传统基于特征的方法(节点层级特征)

前面几篇介绍了图机器学习的基础一些背景知识,我们知道图机器学习任务分为多个层级:

  • 节点层级任务
  • 边层级任务
  • 子图层级任务
  • 图层级任务

这篇主要讲传统的基于特征方法的节点层级任务。我们将讨论节点级特性及其应用。节点级特征关注图中节点的特征,可分为基于重要性和基于结构两种。

1. 不同层级特征

下图展示了不同层级的特征:

在这里插入图片描述

其中节点特征可以由下两部分组成:

  • 节点附加信息,如节点特征。
  • 节点结构信息,如节点在图中位置。

2. 传统的机器学习流水线

传统机器学习流水线有两个步骤:

在这里插入图片描述

  • 第一步:我们取数据(数据点、节点、边、整图),将这些表示成特征向量。最重要的是,我们去训练典型机器学习任务(比如分类器)
  • 第二步:我们获得训练好的特征,去做预测。

3. 特征设计

在这里插入图片描述

使用有效的特征是十分重要的,能很好的表示你想表示的东西,这是模型获得很好效果的关键。传统机器学习利用人工设计特征的方式,我们将从三个层级来学习传统特征设计方式。

在这里插入图片描述

我们的特征设计与目标任务紧密相关,整体任务可以看下图:

在这里插入图片描述

主要就是我们如何去学习这个映射函数 f f f

4. 节点层级任务

在这里插入图片描述

节点层级任务和特征集中描述个体节点,我们将这种任务称为半监督学习任务(semi-supervised task)。在这类任务中,会给出整图,并给出一些有标签的节点(绿色、红色),用这些有标签的节点去预测无标签的节点。

节点层级任务主要目标:

在这里插入图片描述

我们要很好的利用图结构信息(节点度、节点中心、聚类信息等)表述节点特征。

4.1 节点特征——度

在这里插入图片描述

4.2 节点特征——中心信息(Centrality)

节点的度信息十分重要,但也有一些问题:

在这里插入图片描述

首先是节点的度信息没有考虑周围节点的重要性

4.2.1 特征向量中心(Eigenvector centrality)

在这里插入图片描述

4.2.2 中间性中心(Betweenness centrality)

在这里插入图片描述

4.2.3 亲密关系中心(Closeness centrality)

在这里插入图片描述

4.3 节点特征——聚类系数(Clustering Coefficient)

在这里插入图片描述

4.4 节点特征——Graphlets

在这里插入图片描述

在这里插入图片描述

“有根连通的非同构子图”

相关定义:

在这里插入图片描述

举例:

在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值