基于模版查询
基于语义解析
Semantic Parsing 自然语言转成SparQL/SQL,一种偏 linguistic 的方法,把自然语言转化为一系列形式化的逻辑形式,通过对逻辑形似进行自底向上的解析,得到一种可以表达整个问题语义的逻辑形式,通过相应的查询语句在知识库中进行查询,从而得出答案。
基于检索排序
Information Extraction 通过提取问题中的实体,在知识库中查询该实体可以得到以该实体为中心的知识库子图,子图中的每个节点或周边都可以作为候选答案,通过观察问题依据某些规则或模版进行信息抽取,得到问题特征向量,建立分类器,通过输入问题特征向量对候选答案进行筛选,得到最终答案。
流程:抽取实体,抽取属性,和KB建立链接,构建子图, 建立模型预测,给出答案
基于深度学习
Vector Modeling 根据问题得出候选答案,把问题和答案映射为分布式表达,通过训练数据对该分布式进行训练,使得问题和正确答案的向量表达得分(点乘)尽量高,模型训练完成后则可根据候选答案的向量表达和问题表达得分进行筛选,得出最终答案。
结合点:问题提取实体,抽取知识库子图,通过 dl 训练实体和子图关系,并得到 score 排序。
- Entity Linking in 100 Languages. (EMNLP 2020).
- An E