【网络表示学习】LINE

LINE是一种大规模信息网络嵌入方法,适用于有向图、无向图和带权重的网络。它通过一阶和二阶相似性建模,优化目标函数并采用负采样和边采样策略,提高了效率和效果。相较于DeepWalk,LINE在社交网络等场景下表现更优。
摘要由CSDN通过智能技术生成

题目:LINE: Large-scale Information Network Embedding

作者:Jian Tang, Meng Qu, Mingzhe Wang, Ming Zhang, Jun Yan, and Qiaozhu Mei

来源:WWW 2015

源码:https://github.com/tangjianpku/LINE

https://github.com/snowkylin/line

这篇文章是北大发表在WWW 2015上的论文,本文主要关注在大规模网络中进行网络节点表示。LINE可用于有向图、无向图以及边有权重的网络。相比于DeepWalk通过随机游走的序列生成方法,LINE对节点一阶相似度和二阶相似度进行建模,根据权重对边进行采样训练。该方法效率高,在工业界中也得到广泛应用。

本文主要亮点

  • 优化的目标函数设计的比较好
  • 边采样方法能够克服传统的随机梯度下降方法的缺陷,同时提高最后结果的计算效率和效果(efficiency and effectiveness)。

LINE 算法对所有的第一级相似度和第二级相似度节点对进行了概率建模, 并最小化该概率分布和经验分布之间的 KL 距离, 参数学习由随机梯度下降算法决定。

相比DeepWalk纯粹随机游走的序列生成方式,LINE可以应用于有向图、无向图以及边有权重的网络,并通过将一阶、二阶的邻近关系引入目标函数,能够使最终学出的node embedding的分布更为均衡平滑,避免DeepWalk容易使node embedding聚集的情况发生。【转自 https://zhuanlan.zhihu.com/p/58805184】

模型

一阶相似性定义

网络中的一阶相似性是两个顶点之间的局部点对的邻近度。对于由边 ( u , v ) (u,v) (u,v) 链接的每对顶点,该边缘的权重 W u v W_{uv} Wuv 表示 u u u v v v 之间的一阶相似性,如果在u u u u v v v 之间没有观察到边,它们的一阶相似性为0。

定义两个点 i , j i,j i,j 之间的相似度为
p 1 ( v i , v j ) = 1 1 + e x p ( − u i ⃗ T ⋅ u i ⃗ ) p_1(v_i,v_j)=\frac{1}{1+exp(- {\vec{u_i}}^{\mathrm{T}} \cdot \vec{u_i} )} p1(vi,vj)=1+exp(ui Tui )1
经验相似度
p ^ 1 ( i , j ) = w i j W \hat{p}_1(i,j) = \frac{w_{ij}}{W} p^1(i,j)=Wwij
W W W 是所有边权值之和

KL距离,两个分布之间的距离
O 1 = d ( p ^ 1 ( ⋅ , ⋅ ) , p 1 ( ⋅ , ⋅ ) ) O_

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值