【网络表示学习】SDNE

最新推荐文章于 2023-03-04 21:41:17 发布

zjwreal

最新推荐文章于 2023-03-04 21:41:17 发布

阅读量1.3k

点赞数

分类专栏：网络表示学习网络表示学习

本文链接：https://blog.csdn.net/zjwreal/article/details/90551526

版权

网络表示学习同时被 2 个专栏收录

16 篇文章 3 订阅

订阅专栏

网络表示学习

15 篇文章 2 订阅

订阅专栏

题目：Structural Deep Network Embedding

作者：Daixin Wang, Peng Cui, Wenwu Zhu

来源：KDD 2016

源码：https://github.com/suanrong/SDNE

SDNE是第一个将深度学习应用于网络表示学习中的方法。SDNE使用一个自动编码器结构来同时优化1阶和2阶相似度(LINE是分别优化的)，学习得到的向量表示能够保留局部和全局结构，并且对稀疏网络具有鲁棒性。

和之前使用浅层神经网络的方法(deepwalk)不同, SDNE使用深层神经网络对节点表示间的非线性进行建模。整个模型可以被分为两个部分: 一个是由 Laplace 矩阵监督的建模第一级相似度的模块, 另一个是由无监督的深层自编码器对第二级相似度关系进行建模. 最终 SDNE 算法将深层自编码器的中间层作为节点的网络表示。

模型

相似度定义

SDNE可以看做是基于LINE的扩展，相似度定义和LINE是一样的。1阶相似度衡量的是相邻的两个顶点对之间相似性（本地网络结构）。2阶相似度衡量的是，两个顶点他们的邻居集合的相似程度（全局网络结构）。

SDNE是一个半监督模型，其中无监督的部分通过重建每个节点的邻居结构保留图的二阶相似度；对于小部分节点对，利用其一阶相似度作为监督信息进行优化。

二阶相似度优化目标

$\mathcal{L}=\sum_{i=1}^{n}\left\|\hat{\mathbf{x}}_{i}-\mathbf{x}_{i}\right\|_{2}^{2}$

这里我们使用图的邻接矩阵进行输入，对于第 $i$ 个顶点，有 $x_i = s_i$ ，每一个 $s_i$ 都包含了顶点 $i$ 的邻居结构信息，所以这样的重构过程能够使得结构相似的顶点具有相似的embedding。

这里存在的一个问题是由于图的稀疏性，邻接矩阵 $S$ 中的非零元素是远远少于零元素的，那么对于神经网络来说只要全部输出0也能取得一个不错的效果，这不是我们想要的。

文章给出的一个方法是使用带权损失函数，对于非零元素具有更高的惩罚系数。修正后的损失函数为
$\begin{aligned} \mathcal{L}_{2 n d} &=\sum_{i=1}^{n}\left\|\left(\hat{\mathbf{x}}_{i}-\mathbf{x}_{i}\right) \odot \mathbf{b}_{\mathbf{i}}\right\|_{2}^{2} \\ &=\|(\hat{X}-X) \odot B\|_{F}^{2} \end{aligned}$
其中 $\odot$ 为逐元素积， $\mathbf{b}_{\mathbf{i}}=\left\{b_{i, j}\right\}_{j=1}^{n}$ 。如果 $s_{i,j} = 0, b_{i,j} =1$ ，否则 $b_{i,j} = \beta >1$ 。

一阶相似度优化目标

$\begin{aligned} \mathcal{L}_{1 s t} &=\sum_{i, j=1}^{n} s_{i, j}\left\|\mathbf{y}_{i}^{(K)}-\mathbf{y}_{j}^{(K)}\right\|_{2}^{2} \\ &=\sum_{i, j=1}^{n} s_{i, j}\left\|\mathbf{y}_{i}-\mathbf{y}_{j}\right\|_{2}^{2} \end{aligned}$

其中 $\mathbf{y}_i^{(K)}$ 是第 $i$ 个节点第 $k$ 层的输出，即隐含空间表示。该损失函数可以让图中的相邻的两个顶点对应的embedding vector在隐含空间接近。

$\mathcal{L}_{1 s t}$ 还可以表示为
$\mathcal{L}_{1 s t}=\sum_{i, j=1}^{n} s_{i, j}\left\|\mathbf{y}_{i}-\mathbf{y}_{j}\right\|_{2}^{2}=2 \operatorname{tr}\left(Y^{T} L Y\right)$
其中L是图对应的拉普拉斯矩阵， $L = D - S$ ， $D_{i, i}=\sum_{j} s_{i, j}$ 。

整体优化目标

联合优化目标函数
$\begin{aligned} \mathcal{L}_{m i x} &=\mathcal{L}_{2 n d}+\alpha \mathcal{L}_{1 s t}+\nu \mathcal{L}_{r e g} \\ &=\|(\hat{X}-X) \odot B\|_{F}^{2}+\alpha \sum_{i, j=1}^{n} s_{i, j}\left\|\mathbf{y}_{i}-\mathbf{y}_{j}\right\|_{2}^{2}+\nu \mathcal{L}_{r e g} \end{aligned}$
$\mathcal{L}_{r e g}$ 是L2正则化项， $\alpha$ 为控制1阶损失的参数， $\nu$ 为控制正则化项的参数。
$\mathcal{L}_{\text {reg}}=\frac{1}{2} \sum_{k=1}^{K}\left(\left\|W^{(k)}\right\|_{F}^{2}+\left\|\hat{W}^{(k)}\right\|_{F}^{2}\right)$