DeepWalk: Online Learning of Social Representations

这篇论文主要介绍了如何把自然语言处理模型word2vec的方法应用到网络的节点表示中,通过word2vec的方法把网络学习为向量的潜层表示,能把网络中的联系编码到连续的向量空间中,这样网络的关系就能够很方便的通过各种统计模型来对这些网络中的联系进行各种应用。
简介
本文通过将已经成熟的自然语言处理模型word2vec应用到网络的表示上,做到了无需进行矩阵分解即可表示出网络中的节点的关系。
DeepWalk把对图中节点进行的一串随机游走类比于word2vec中对单词的上下文,作为word2vec算法的输入,进而把节点表示成向量。输出的结果能够被多种分类算法作为输入应用。
主要成果
通过对网络进行短随机游走生成了可以被统计模型应用的网络表示
所学得的表示在多标签分类任务中,性能优于已有算法。某些情况下,甚至能在训练样本较少时获得更好结果。
能对web-scale下的网络进行表示
目标问题
在这里插入图片描述
输入:一个图的点集和边集
输出 :对于(其中X是特征,Y是标签集合),一般的机器学习问题,需要学习一个从X映射到Y的假设。而本文的任务是学习得到X的低维表示。
理论支持
自然语言已经被证明是复合幂次定律,只需要证明图的数据也符合幂次定律就可以对图的表示应用对自然语言表示的方法。下图对比了对图进行短随机游走汇总向量出现的频率与单词在文本信息中出现的频率。发现对图的短随机行走也是大致满足幂次定律的。
在这里插入图片描述
算法介绍
算法一:短随机游走生成
DeepWalk(G, w, d, γ, t)
input:graph G(V,E)
output:matrix of vertex representations
将输入的图的点集进行随机打乱(shuffle()函数),然后输入到skipgram算法中进行表示学习。
算法二:word2vec中skipgram算法
在这里插入图片描述
实验
多标签分类
baseline:
spectralclustering
modularity
edgecluste
wvrn
majority

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值