机器问答系统流程如下图所示:
具体过程:
(1)准备知识库,可以从维基百科或者百度百科中获取,知识库主要是存储实体与实体介绍文本,也就是百科中的词条与词条介绍。
(2)流程中涉及到三个模型:实体提取模型用来确定问题包含的实体,在知识库中查找确认对应介绍文本;如果实体不存在,可以考虑通过相似实体模型替换成相似的实体,比如同一个人不同称呼。最后,将实体文本作为阅读理解的上下文输入到QA阅读理解问答模型中即可得到答案。
参考文章:https://zhuanlan.zhihu.com/p/333682032
参考代码:https://github.com/nocoolsandwich/iamQA
不足:采用相似实体搜索得到的答案不是很好。