【网络表示学习】LINE

最新推荐文章于 2022-07-18 22:13:25 发布

zjwreal

最新推荐文章于 2022-07-18 22:13:25 发布

阅读量2k

点赞数 1

分类专栏：网络表示学习网络表示学习文章标签： Network Embedding 表示学习

本文链接：https://blog.csdn.net/zjwreal/article/details/88385509

版权

LINE是一种大规模信息网络嵌入方法，适用于有向图、无向图和带权重的网络。它通过一阶和二阶相似性建模，优化目标函数并采用负采样和边采样策略，提高了效率和效果。相较于DeepWalk，LINE在社交网络等场景下表现更优。

摘要由CSDN通过智能技术生成

题目：LINE: Large-scale Information Network Embedding

作者：Jian Tang, Meng Qu, Mingzhe Wang, Ming Zhang, Jun Yan, and Qiaozhu Mei

来源：WWW 2015

源码：https://github.com/tangjianpku/LINE

https://github.com/snowkylin/line

这篇文章是北大发表在WWW 2015上的论文，本文主要关注在大规模网络中进行网络节点表示。LINE可用于有向图、无向图以及边有权重的网络。相比于DeepWalk通过随机游走的序列生成方法，LINE对节点一阶相似度和二阶相似度进行建模，根据权重对边进行采样训练。该方法效率高，在工业界中也得到广泛应用。

本文主要亮点

优化的目标函数设计的比较好
边采样方法能够克服传统的随机梯度下降方法的缺陷，同时提高最后结果的计算效率和效果（efficiency and effectiveness）。

LINE 算法对所有的第一级相似度和第二级相似度节点对进行了概率建模, 并最小化该概率分布和经验分布之间的 KL 距离，参数学习由随机梯度下降算法决定。

相比DeepWalk纯粹随机游走的序列生成方式，LINE可以应用于有向图、无向图以及边有权重的网络，并通过将一阶、二阶的邻近关系引入目标函数，能够使最终学出的node embedding的分布更为均衡平滑，避免DeepWalk容易使node embedding聚集的情况发生。【转自 https://zhuanlan.zhihu.com/p/58805184】

模型

一阶相似性定义

网络中的一阶相似性是两个顶点之间的局部点对的邻近度。对于由边 $(u, v)$ 链接的每对顶点，该边缘的权重 $W_{uv}$ 表示 $u$ 和 $v$ 之间的一阶相似性，如果在 $u$ $u$ 和 $v$ 之间没有观察到边，它们的一阶相似性为0。

定义两个点 $i, j$ 之间的相似度为
$p_1(v_i,v_j)=\frac{1}{1+exp(- {\vec{u_i}}^{\mathrm{T}} \cdot \vec{u_i} )}$
经验相似度
$\hat{p}_1(i,j) = \frac{w_{ij}}{W}$
$W$ 是所有边权值之和