四、图嵌入表示学习【CS224W】(Datawhale组队学习)

文章介绍了图表示学习的目标,即学习节点的低维连续向量表示,使相似节点在向量空间中接近。重点讨论了基于随机游走的图嵌入方法,如DeepWalk和Node2Vec,DeepWalk采用无偏随机游走,而Node2Vec通过调整参数实现有偏随机游走,增强节点语义信息的捕获。这些方法在不使用节点属性信息的情况下,仅依赖图结构进行无监督学习。
摘要由CSDN通过智能技术生成

请添加图片描述

开源内容:https://github.com/TommyZihao/zihao_course/tree/main/CS224W

子豪兄B 站视频:https://space.bilibili.com/1900783/channel/collectiondetail?sid=915098

斯坦福官方课程主页:https://web.stanford.edu/class/cs224w

图嵌入-概述

在这里插入图片描述
在这里插入图片描述

图表示学习的目标

目标:通过图机器学习学习与下游任务无关的特征

  • 低维:向量维度远小于节点数
  • 连续:每个元素都是实数
  • 稠密:每个元素都不为0
    在这里插入图片描述

图嵌入的目标

任务:将节点嵌入到d维空间

  • 向量相似度反映节点的相似性
  • 嵌入向量包含网络的连接信息
  • 图嵌入可以用于很多潜在的下游任务
    在这里插入图片描述

图嵌入的基本框架(编码器-解码器)

为了简化表示,我们仅利用节点的连接信息,没有利用节点的属性信息

节点相似度表示

节点的相似度表示要人为的去定义
在这里插入图片描述
我们可以从以下几个方面来考虑两个节点的相似性

  • 直接相连
  • 间接相连
  • 相同功能角色

在这里插入图片描述
在这里插入图片描述

编码器

最简单的编码器:查表
在这里插入图片描述
在这里插入图片描述
最简单的编码方式:编码器进行嵌入式查找
每个节点表示为一个嵌入向量,我们可以对节点组成的嵌入向量矩阵 Z Z Z进行优化,常见的优化方法有:Deepwalk和node2vec等

框架总结

在这里插入图片描述

  • 这是一种无监督/自监督学习节点嵌入的方式
    • 没有使用节点的类别标签
    • 没有使用节点的属性特征
    • 直接优化嵌入向量
  • 与下游任务无关
  • 节点嵌入不是为了特定的下游任务训练的,它们能用于任何任务

图嵌入——基于随机游走的方法

图机器学习的问题可以和NLP问题进行对应

图机器学习->NLP
图->文章
随机游走序列->句子
节点->单词
Deepwalk->Ship-Gram
Node Embeding->Word Embeding

  • DeepWalk
    • 首个将深度学习和自然语言处理的思想用于图机器学习。
    • 在稀疏标注节点分类场景下,嵌入性能卓越。
    • 均匀随机游走,没有偏向的游走方向。(Node2Vec)
    • 需要大量随机游走序列训练。
    • 基于随机游走,管中窥豹。距离较远的两个节点无法相互影响。看不到全图信息。(图神经网络)
    • 无监督,仅编码图的连接信息,没有利用节点的属性特征。
    • 没有真正用到神经网络和深度学习。

  • Node2Vec 图嵌入算法
    • Node2Vec解决 图嵌入 问题,将图中的每个节点映射为一个向量(嵌入)。
    • 向量(嵌入)包含了节点的语义信息(相邻社群和功能角色)。
    • 语义相似的节点,向量(嵌入)的距离也近。
    • 向量(嵌入)用于后续的分类、聚类、Link Prediction、推荐等任务。
    • 在DeepWalk完全随机游走的基础上,Node2Vec增加p、q参数,实现有偏 随机游走。不同的p、q组合,对应了不同的探索范围和节点语义。
    • DFS深度优先探索,相邻的节点,向量(嵌入)距离相近。
    • BFS广度优先探索,相同功能角色的节点,向量(嵌入)距离相近。
    • DeepWalk是Node2Vec在p=1,q=1的特例。

总结

本篇文章讨论了图表示学习,一种可以学习节点和图的嵌入用于下游任务而不需要人工特征工程的方法。采用了编码器-解码器的框架,编码器进行嵌入查找,解码器对嵌入预测得分来计算节点的相似度,讨论了节点相似度方法DeepWalk和Node2vec。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

卡拉比丘流形

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值