最近,随着深度学习的发展,基于神经网络的方法被用于 基于知识图谱的问答 的任务,和之前的方法不同,基于神经网络的方法将问题和答案表示为语义向量,之后 基于知识图谱的问答 就转变成一个在 问题的语义向量 和 候选答案的语义向量 之间的相似度匹配问题,有最高匹配度的答案就是最终答案。
(感觉这里既然NN将Q
向量map到A
向量,那么求Q
和A'
之间的相似度也就是求A
和A'
之间相似度)
在 基于神经网络的方法,关键是计算问题和答案之间的相似度,所以关键在于训练 问题和答案的向量表示,之前的研究重点放在训练出 答案向量 的表示,而 问题向量 的训练就用BOW模型。
以“法国总统是谁”和答案是“某人”为例,“谁”这个字是最重要的词,显然这是一个注意力机制。
之前有研究将问题通过3个CNN表示成向量,
在知识图谱里,一个候选答案有多个方面和问句语义相同,上下文、类别、到主实体的path等,
答案的一些东西 和 问题 也有相同的地方。
我们进一步,用一个基于注意力机制的神经网络 关联问题和答案,答案不同会影响问题的向量表示也不同。
例如,一个QA对(q,a)
出现在训练集里,知识库告诉我们a
和a'
比较接近,记作(a~a')
,那么(q,a')
就更可能是正确的,然而,现在的QA训练机制是不能保证(a~a')
被训练出来的