LINE 图向量

最新推荐文章于 2022-03-21 10:58:18 发布

xiao___qiao

最新推荐文章于 2022-03-21 10:58:18 发布

阅读量1.1k

点赞数

分类专栏： graph 文章标签： graph 深度学习

本文链接：https://blog.csdn.net/qq_37074299/article/details/113668111

版权

5 篇文章 1 订阅

订阅专栏

1 目的和思想

LINE 模型的目的：将图的顶点表示为向量
LINE 的整体思想：不仅仅考虑一阶相似（直接相连的 node），同时考虑二阶相似（不直接相连的 node，但是邻居有较多公共 node）
模型出自论文: LINE: Large-scale Information Network Embedding

模型实现（两个不同的模型）：

第一个模型：First-order Proximity
第二个模型：Second-order Proximity

First-order Proximity：一阶相似，表示两个node直接连接，6和7
Second-order Proximity：二阶相似，表示两个node没有直接向量，但是他们的邻居有很多相同，5和6
在这里插入图片描述

仅能用于无向图
在这里插入图片描述

适用于有向图和无向图，无向图可以认为是方向相反，权重相同的边
在这里插入图片描述

顶点可作为当前顶点或其他顶点的上下分布，有相似的上下分布的顶点是相似的

$\vec{u_i}$ 表示 $v_i$ 被当作顶点，
$\vec{u_i}^{'}$ 表示 $v_i$ 被当作顶点的上下顶点
$∣ V ∣$ 表示上下顶点个数
经验分布

$w_{ij}$ 表示边权重
$d_i$ 表示顶点 $i$ 的出度

$N (i)$ 是 $v_i$ 的出度集合
目标函数

$d (\cdot, \cdot)$ 表示两个分布之间的距离
同样利用 KL-散度代替 $d (\cdot, \cdot)$ ，并省略一些常数，最终目标函数

对于目标函数，计算量大，采用负采样，得到新目标函数在这里插入图片描述

KL-散度就是相对熵
在这里插入图片描述
P代表真实分布，Q代表预测分布，当预测接近真实，散度就越小，则损失也就越小

LINE 能够解决一阶相似和二阶相似，但是graph embedding需要两个模型的联合才能得到更好的效果

关注