我将能表示论元大意的图片一一给出.然后再给出解释:
远程监督学习就是给包打标签, 一个包里的所有句子包含的实体对是相同的. Figure 1也就是本文的做法就是将包里所有的句子一起处理, 确定实体对的关系(不是一个关系类型,一个包可能有多个关系)
Figure 3给出一句话的处理过程, 首先将句子pad 零到句长为h, 然后将句子每个词都转换为embedding(word embedding + 两个位置embedding), 通过卷积得到
c
c
= [c
1
1
, c
2
2
,…, c
(h−wc+1)
(
h
−
w
c
+
1
)
], 接着利用piecewise max-pooling 得到Sentence Representation
p
p
∈
∈
R
3n
3
n
如果一个包里有m个句子, 每个句子都要经过Figure 3的处理得到
p(1)
p
(
1
)
,
p(2)
p
(
2
)
, … ,
p(m)
p
(
m
)
, 然后经过Figure2的处理得到
g
g
, 最后经过输出层得到包的关系
关于损失函数本文用了两个, 还有多标签的问题,这个稍后讨论