Translating embeddings for modeling multi-relational data
0. 目的
将多关系数据中的实体和关系嵌入到低维空间中去表示
1. 总结
提出一种基于翻译的模型 TransE, 将 relation(关系) 看作是在低维空间中由 head entity(头实体) 到 tail entity(尾实体) 的一种翻译
2. 主要思想
- 对于正确的关系 l t l_t lt, 使得 d ( h + l t , t ) d(\mathbf{h+l_t}, \mathbf{t}) d(h+lt,t) 接近于0
- 对于错误的关系 l f l_f lf, 使得 d ( h + l f , t ) d(\mathbf{h+l_f}, \mathbf{t}) d(h+lf,t) 尽可能大
其中 d ( a , b ) d(\mathbf{a},\mathbf{b}) d(a,b) 表示 a \mathbf{a} a 和 b \mathbf{b} b 的相似度( L 1 L_1 L1范数 或 L 2 L_2 L2范数)
3. 方法
优化目标: margin-based loss fuction
L
=
∑
(
h
,
r
,
t
)
∈
S
(
h
′
,
r
,
t
′
)
∈
S
′
max
(
0
,
f
(
h
,
r
,
t
)
+
γ
−
f
(
h
′
,
r
,
t
′
)
)
L=\sum_{(h, r, t) \in \mathcal{S}\left(h^{\prime}, r, t^{\prime}\right) \in \mathcal{S}^{\prime}} \max \left(0, f(h, r, t)+\gamma-f\left(h^{\prime}, r, t^{\prime}\right)\right)
L=(h,r,t)∈S(h′,r,t′)∈S′∑max(0,f(h,r,t)+γ−f(h′,r,t′))
其中
f
(
h
,
r
,
t
)
f(h, r, t)
f(h,r,t)表示正样本,
f
(
h
′
,
r
,
t
′
)
f\left(h^{\prime}, r, t^{\prime}\right)
f(h′,r,t′)表示负样本.
γ
\gamma
γ为
m
a
r
g
i
n
margin
margin, 表示正样本的分数要比负样本分数高出多少.
TransE 算法如下, 其中
u
n
i
f
o
r
m
uniform
uniform 表示均匀分布.
4. Question
- 在 1-N, N-1, N-N 关系上评估结果方差特别大, 不能处理这三种关系