Variational Graph Auto-Encoders
Year: 2016
Authors: Thomas N. Kipf, Max Welling
Journal Name: NIPS
Definitions
定义含有 N = ∣ V ∣ N=|V| N=∣V∣ 个节点的无向图 G = ( V , E ) \mathcal{G}=(\mathcal{V}, \mathcal{E}) G=(V,E) ,邻接矩阵 A A A 和度矩阵 D D D ,再引入 N × F N \times F N×F 大小的隐变量矩阵 Z = [ z 1 ; z 2 ; . . . ; z N ] Z=[z_1; z_2; ...;z_N] Z=[z1;z2;...;zN] 和 N × D N \times D N×D 大小特征矩阵 X X X 。
Inference model
作者采用两层 GCN 来估计推断模型的参数
q
(
Z
∣
X
,
A
)
=
∏
i
=
1
N
q
(
z
i
∣
X
,
A
)
q
(
z
i
∣
X
,
A
)
=
N
(
z
i
∣
μ
i
,
d
i
a
g
(
σ
i
2
)
)
q(Z | X, A) = \prod_{i=1}^N q(z_i | X, A) \\ q(z_i | X, A) = \mathcal{N}(z_i | \mu_i, diag(\sigma_i^2))
q(Z∣X,A)=i=1∏Nq(zi∣X,A)q(zi∣X,A)=N(zi∣μi,diag(σi2))
其中,
μ
=
G
C
N
μ
(
X
,
A
)
\mu = GCN_{\mu}(X, A)
μ=GCNμ(X,A) 为均值向量
μ
i
\mu_i
μi 组成的矩阵,同理
l
o
g
σ
=
G
C
N
σ
(
X
,
A
)
log \sigma = GCN_{\sigma}(X, A)
logσ=GCNσ(X,A) 。
G
C
N
(
X
,
A
)
=
A
~
r
e
l
u
(
A
~
X
W
0
)
W
1
GCN(X, A) = \widetilde{A} \ relu(\widetilde{A} X W_0) W_1
GCN(X,A)=A
relu(A
XW0)W1 ,其中
A
~
=
D
−
1
2
A
D
−
1
2
\widetilde{A} = D^{-\frac{1}{2}} A D^{-\frac{1}{2}}
A
=D−21AD−21 为标准化后的邻接矩阵,
G
C
N
μ
GCN_{\mu}
GCNμ 和
G
C
N
σ
GCN_{\sigma}
GCNσ 共享权重
W
0
W_0
W0 。
Generative model
生成模型简单的采用两个隐变量的内积
p
(
A
∣
Z
)
=
∏
i
=
1
N
∏
j
=
1
N
p
(
A
i
j
∣
z
i
,
z
j
)
p
(
A
i
j
=
1
∣
z
i
,
z
j
)
=
s
i
g
m
o
i
d
(
z
i
⊤
z
j
)
p(A | Z) = \prod_{i=1}^N \prod_{j=1}^N p(A_{ij} | z_i, z_j) \\ p(A_{ij} = 1 | z_i, z_j) = sigmoid(z_i^{\top} z_j)
p(A∣Z)=i=1∏Nj=1∏Np(Aij∣zi,zj)p(Aij=1∣zi,zj)=sigmoid(zi⊤zj)
Learning
损失函数为
L
=
E
q
(
Z
∣
X
,
A
)
[
l
o
g
p
(
A
∣
Z
)
]
−
K
L
[
q
(
Z
∣
X
,
A
)
∥
p
(
Z
)
]
L = \mathbb{E}_{q(Z | X, A)}[logp(A | Z)] - KL[q(Z | X, A) \| p(Z)]
L=Eq(Z∣X,A)[logp(A∣Z)]−KL[q(Z∣X,A)∥p(Z)]
其中, p ( Z ) = ∏ i p ( z i ) = ∏ i N ( z i ∣ 0 , I ) p(Z) = \prod_i p(z_i) = \prod_i \mathcal{N}(z_i | 0, I) p(Z)=∏ip(zi)=∏iN(zi∣0,I) 为高斯先验。
Non-probabilistic graph auto-encoder (GAE) model
对于 VGAE 模型的非概率变体
A
^
=
s
i
g
m
o
i
d
(
Z
Z
⊤
)
Z
=
G
C
N
(
X
,
A
)
\hat{A} = sigmoid(ZZ^{\top}) \\ Z = GCN(X, A)
A^=sigmoid(ZZ⊤)Z=GCN(X,A)
Result
GAE* 和 VGAE* 没有使用特征
X
X
X , AUC 为 area under the ROC curve , AP 为 average precision 。