论文终于提交了,心情非常激动。。从去年9月开始做知识库问答到现在,总算是可以告一段落了。从前期的调研,到11月份艰难地复现别人的论文,12月1月看论文调模型,中间几近放弃。。3.9又重新开始跑模型,3.19开始写论文,到今天全部完成,深刻地体会到科研的道路真是道阻且长。趁着对KBQA的浅薄理解,在这里做个总结吧。
从开这个坑到现在已经十天过去了。。今天终于有时间来把坑填上。
这期间把论文放到了arxiv,没想到没几天时间就有很多人发邮件来要源码要数据。。看来知识库问答最近真是太火了。
这篇综述不谈我的工作,只讲我的参考文献的工作。
Overview
我在 各类QA问答系统的总结与技术实现 中已经简要地介绍过解决KBQA的三种方法:语义解析、信息抽取、向量建模。前两种方法偏向于传统NLP的句法、语法分析,需要人工构建特征,效果较单纯的向量建模方法要好。而这几个方向都有结合深度学习的方法提出,其中语义解析+深度学习在WebQuestion数据集上达到了最高的F1score。根据近几年这一领域的论文效果,我做了一个对比图:
这里主要关注WebQuestion和SimpleQuestion这两个数据集。这两个数据集均是基于Freebase构建的,其中WebQues