DeepWalk: Online Learning of Social Representations

链接: link.

摘要

提出了DeepWalk,这是一种用于学习网络中顶点的潜在表示的新方法。这些潜在的表示编码在连续向量空间中的社交关系,这可用于统计模型中。
DEEPWALK使用从截断的随机游走中获取的局部信息来学习潜在表示,通过把游走视为句子的等效。我们演示了DeepWalk针对社交网络(如BlogCatalog,Flickr和YouTube)的多个多标签网络分类任务的潜在表示。当标记数据稀疏时,DeepWalk的表示比baselines高了10%的F1分数,使用的训练数据少60%。
DeepWalk也是可扩展的。它是一种在线学习算法,可以构建有用的增量结果,并且可以简单地并行化。这些特性使其适用于广泛的现实世界应用,如网络分类和异常检测

1. INTRODUCTION

网络表示的稀疏性既是优势,也是弱点。稀疏性使得能够设计有效的离散算法,但是使得在统计学习中更难概括。网络中的机器学习应用(例如网络分类,内容推荐,异常检测和缺失链路预测)必须能够处理这种稀疏性才能生存。
在本文中我们首次将深度学习(无监督特征学习)技术引入网络分析。我们开发了一种算法DeepWalk,通过对短随机游走流进行建模来学习图顶点的社交表示。社交表示是捕获邻域相似性和社区成员的顶点的潜在特征。这些潜在表示在具有相对较少维度的连续向量空间中编码社交关系。DeepWalk概括了神经语言模型,以处理由一组随机游走生成组成的特殊语言。
DeepWalk将图作为输入并生成潜在表示作为输出。
在这里插入图片描述
图1:我们提出的方法学习了Rd中社交互动的潜在空间表示。学习的表示对社区结构进行编码,因此可以用于标准的分类方法。
我们评估DeepWalk在大型异构图中具有挑战性的多标签网络分类问题的性能。
本文贡献:

  • 我们将深度学习作为分析图形的工具,构建适用于统计建模的强大表示。DeepWalk了解短随机游走中存在的结构规律。
  • 广泛评估了在多个社交网络上的多标签分类任务的表示。我们在标签稀疏性的情况下显示出显着提高的分类性能。
  • 我们通过使用并行实现构建网络规模图表(例如YouTube)的表示来展示我们算法的可扩展性。此外,我们描述了构建流式版本方法所需的最小变化。

2. PROBLEM DEFINITION

我们考虑将社交网络的成员分类为一个或多个类别的问题。
我们提出了一种不同的方法来捕获网络拓扑信息。我们提出了一种无监督的方法,它可以学习捕获图形结构的特征而不依赖于标签的分布,而不是将标签空间混合为特征空间的一部分。结构表示和标记任务之间的这种分离避免了级联错误

3.LEARNING SOCIAL REPRESENTATIONS

我们寻求学习有以下特征的社交表示:

  • 适应性-真实社交网络在
  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值