【论文笔记】Question Answering over Freebase with Multi-Column Convolutional Neural Networks

最新推荐文章于 2021-02-20 12:06:45 发布

Lawe

最新推荐文章于 2021-02-20 12:06:45 发布

阅读量3k

点赞数 1

分类专栏：论文笔记 Question Answering 文章标签： KBQA 自动问答深度学习

本文链接：https://blog.csdn.net/LAW_130625/article/details/78447156

版权

本文介绍了ACL 2015年的一篇论文，提出了一种使用Multi-Column Convolutional Neural Networks (MCCNNs)解决基于Freebase的知识库问答（KBQA）方法。通过理解答案路径、答案上下文和答案类型，模型在WEBQUESTIONS数据集上表现出色，同时指出了候选答案生成、时间相关问题和歧义问题作为未来改进的方向。

摘要由CSDN通过智能技术生成

一、概要
该文章发于ACL 2015，作者提出了一个基于Freebase，使用multi-column convolutional neural networks(MCCNNs)的自动问答模型，分别从答案路径（answer path）, 答案背景信息（answer context）, 以及答案类型（answer type) 来理解问题，并学习它们的分布式表示（distributed representations），在不使用任何手动特征及词表等条件下在问答数据集WEBQUESTIONS 上取得了很好的结果。

二、模型方法
2.1 模型简介
假设存在问题 $q = w_{1} . . . w_{n}$ ，作者使用 Freebase Search API来找到问题中的命名实体，如果问题中不含有任何命名实体或者名词，那么就使用返回最相关的一个命名实体，然后使用其在知识库中悬着候选答案，所有的2-hops 节点的实体和关系都视为候选答案，表示为 $C_{q}$ 。
然后基于每一个候选答案a，根据模型训练得到的答案路径（answer path）, 答案背景信息（answer context）, 以及答案类型（answer type) 的vector representations，以及分别对应的问题的vector representations，即： $f_{1}(q)，f_{2}(q)，f_{3}(q)$ ，最后根据S (q, a)才选出答案，计算方法为：

S(q,a)=f1(q)Tg1(a)+f2(q)Tg2(a)+f3(q)Tg3(a) $S (q, a) =f_{1}(q)^{T}g_{1}(a) + f_{2}(q)^{T}g_{2}(a) + f_{3}(q)^{T}g_{3}(a)$
其中

fi(q)与gi(a) $f_{i}(q)与g_{i}(a)$ 的维度相同，它们的计算方式为內积，最后把三项相加而得。

这里写图片描述

2.2 MCCNNs for Question Understanding
MCCNNs使用了三个管道来学习问题表示和word embeddings，分别对应答案路径，答案背景信息, 以及答案类型。假设存在问题 $q = w_{1} . . . w_{n}$ ，把每个词使用lookup转为词向量，即： $w_{j} = W_{v}u(w_{j})$ ， $W_{v} ∈ R^{d_{v}×|V |}$ ，