《Graph Representation Learning》笔记 Chapter4

最新推荐文章于 2022-10-22 12:54:30 发布

吊儿郎当的凡

最新推荐文章于 2022-10-22 12:54:30 发布

阅读量138

点赞数 1

分类专栏：图表示学习文章标签：机器学习深度学习图论数据挖掘模式识别

本文链接：https://blog.csdn.net/weixin_43269419/article/details/120794655

版权

图表示学习专栏收录该内容

7 篇文章 1 订阅

订阅专栏

系列文章
《Graph Representation Learning》笔记 Chapter2
《Graph Representation Learning》笔记 Chapter3

Reconstructing muti-relational data

RESCAL 定义了解码器
$DEC(u, τ, v) = z_u^TR_τz_v$
其中， $R_τ ∈ \mathbb{R}^{d×d}$ 是针对关系 $τ \in R$ 的一个可学习的矩阵。
我们可以使用一个基本的重构损失来训练 embedding 矩阵 $Z$ 和关系矩阵 $R_τ$
$\begin{aligned} \mathcal{L} &= \sum_{u ∈ \mathcal{V}}{ \sum_{v ∈ \mathcal{V}}{ \sum_{τ ∈ \mathcal{R}}{ \| DEC(u, τ, v) - \mathcal{A}[u, τ, v] \|^2 } } } \\ &= \sum_{u ∈ \mathcal{V}}{ \sum_{v ∈ \mathcal{V}}{ \sum_{τ ∈ \mathcal{R}}{ \| z_u^TR_τz_v - \mathcal{A}[u, τ, v] \|^2 } } } \end{aligned}$
其中 $\mathcal{A} ∈ \mathbb{R}^{|\mathcal{V}|×|\mathcal{R}|×|\mathcal{V}|}$ 是多关系图的邻接张量

Loss function

Cross-entropy with negative sampling

通过改进标准二元交叉熵损失，定义
$\mathcal{L} = \sum_{(u, τ, v) ∈ \mathcal{E}}{ -log(σ(DEC(u, τ, v))) - γ\mathbb{E}_{v_n \sim P_{n, u}(\mathcal{V})}[log(σ(-DEC(u, τ, v_n)))] }$
其中 $σ$ 代表 logistic 函数， $P_{n, u}(\mathcal{V})$ 代表基于 $u$ 的“负样本”（没有 $τ$ 关系的节点对）分布， $γ > 0$ 是一个超参数。
$l o g (σ (D E C (u, τ, v)))$ 代表正确预测两节点间存在 $τ$ 关系的概率对数。
$\mathbb{E}_{v_n \sim P_{n, u}(\mathcal{V})}[log(σ(-DEC(u, τ, v_n)))]$ 代表正确预测两节点间不存在 $τ$ 关系的概率对数。
实际操作中，由于 $P_{n, u}(\mathcal{V})$ 所包含的样本数量过大，我们采用蒙特卡洛采样方法近似计算损失
$\mathcal{L} = \sum_{(u, τ, v) ∈ \mathcal{E}}{ (-log(σ(DEC(u, τ, v))) - \sum_{v_n ∈ \mathcal{P}_{n, u}}{ [log(σ(-DEC(u, τ, v_n)))]} ) }$
其中 $\mathcal{P}_{n, u}$ 是 $P_{n, u}(\mathcal{V})$ 的小子集。

Max-margin loss

最大间隔损失定义为
$\mathcal{L} = \sum_{(u, τ, v) ∈ \mathcal{E}}\sum_{v_n ∈ \mathcal{P}_{n, u}}max(0, -DEC(u, τ, v) + DEC(u, τ, v_n) + Δ)$
当正样本对的解码得分大于负样本对时我们可以获得一个很小的损失， $Δ$ 项称为间隔，正样本解码得分需要比负样本得分大于一个间隔，才能保证 $\mathcal{L}$ 为0。

Multi-relational decoder

Reanslational decoders

TransE 模型定义为
$DEC(u, τ, v) = -\| z_u + r_τ - z_v \|$
节点 u 的 embedding 向量与关系向量 r_τ 相结合后计算与节点 v 的距离，这个距离与节点间关系存在的可能性成比例。
TransX 模型定义为
$DEC(u, τ, v) = -\| g_{1, τ}(z_u) + r_τ - g_{2, τ}(z_v) \|$
其中， $g_{i, τ}$ 为可训练的函数。
TransH 模型定义为
$DEC(u, τ, v) = -\| (z_u - w_r^Tz_uw_r) + r_τ - (z_u -w_r^Tz_vw_r) \|$
其中， $w_r$ 为可训练的向量。

Multi-linear dot products

定义点积解码器
$\begin{aligned} DEC(u, τ, v) &= <z_u, r_τ, z_v> \\ &= \sum_{i=1}^d{ z_u[i] × r_τ[i] × z_v[i]} \end{aligned}$

Complex decoders

上述点积解码器只能解码对称关系，即
$\begin{aligned} DEC(u, τ, v) &= <z_u, r_τ, z_v> \\ &= \sum_{i=1}^d{ z_u[i] × r_τ[i] × z_v[i] } \\ &= <z_v, r_τ, z_u> \\ &= DEC(v, τ, u) \end{aligned}$
为了解决这个问题， ComplEx 引入了复数
$\begin{aligned} DEC(u, τ, v) &= Re(<z_u, r_τ, \bar{z}_v>) \\ &= Re(\sum_{i=1}^d{ z_u[i] × t_τ × \bar{z}_v[j]}) \end{aligned}$
其中， $z_u, z_v, r_τ ∈ \mathbb{C}^d$ 为复数 embeddings ， $R e$ 代表复数向量的实数部分。这个解码器采用了共轭 embeddings $\bar{z}_v$ ，所以适用于非对称关系图。
RotatE 模型依然取 embeddings 为复数，引入旋转的概念
$-\| z_u \circ r_τ - z_v \|$
其中 $\circ$ 代表哈达玛积， $|r_τ[i]| = 1, \forall{i} ∈ {1, ..., d}$ ，这个限制使得 $r_τ[i] = e^{iθ_{r, i}}$ ，使 $z_u[i], \forall{i} ∈ {1, ..., d}$ 能在复平面旋转。

Representational abilities

Symmetry and anti-symmetry

图中许多节点对的关系是对称的，即
$\mathcal{E} \leftrightarrow (v, τ, u) ∈ \mathcal{E}$
所以，反对称关系表示为
$\mathcal{E} \rightarrow (v, τ, u) \notin \mathcal{E}$
TransE 模型只能表示反对称关系，若节点 u 与节点 v 为对称关系
$\begin{aligned} DEC(u, τ, v) &= DEC(v, τ, u) \\ -\| z_u + r_τ - z_v \| &= -\| z_v + r_τ - z_u \| \\ \| z_u-z_v \| + \| r_τ \| - 2\| z_u -z_v \|\|r_τ\|cosθ &= \| z_v-z_u \| + \| r_τ \| - 2\| z_v -z_u \|\|r_τ\|(-cosθ) \\ \| r_τ \| &= -\| r_τ \| \\ \| r_τ \| &= 0 \end{aligned}$
证毕。

Inversion

逆关系为由节点 u 到节点 v 的关系 $τ_1$ 可推导出由节点 v 到节点 u 的关系 $τ_2$
$τ_1, v) ∈ \mathcal{E} \leftrightarrow (v, τ_2, u) ∈ \mathcal{E}$

Compositionality

$τ_1, y) ∈ \mathcal{E} \vee (y, τ_2, v) ∈ \mathcal{E} \rightarrow (u, τ_3, v)$

吊儿郎当的凡

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《Graph Representation Learning》笔记 Chapter4

系列文章《Graph Representation Learning》笔记 Chapter2《Graph Representation Learning》笔记 Chapter3目录Reconstructing muti-relational dataLoss functionCross-entropy with negative samplingMax-margin lossMulti-relational decoderReanslational decodersMulti-linear dot p
复制链接

扫一扫

专栏目录