背景
- 什么是Freebase(什么是知识库):
- Curated KBs知识库是由结构化的三元组(entity, relation/property, entity)所表达的知识组成的知识库,如果把这个三元组用起点-边-终点来表示,这个知识库就可以被表示为指示图。代表:Freebase
- Extracted KBs知识库则是直接从网页中抽取实体关系三元组所组成的知识库,这样的知识更多是自然语言的形式表达的,涉及到entity linking 和 relation extraction两大关键技术。
- 什么是KB-QA:
给定自然语言问题,通过对问题的语义理解,进而利用知识库进行查询、推理以得出答案。特别地,和对话机器人的交互式对话不同,KB-QA的答案是知识库中的实体或者实体关系或者是no answer。 - 基于语义分析的KB-QA:
思路:自然语言表示的问题 —-(语义分析)—->逻辑表达式——>数据库查询语句——>得到结果 - 一点思考:
- 语义分析的基本思路就是将自然语言问题转化成Freebase上的查询语句,那么容易想到这种转化方式有很多种,直观的思路比如通过实体识别(entity recognition)来识别出句子中的实体,再在知识库中查找相应的实体以及它们所连接的其它实体,通过学习算法对这些连接的其它实体是问题答案的可能性进行评分,选择最高的几种作为答案;
- 而传统的一种办法是采用已有的PARSER来得到语义分析结果(逻辑形式Logic Form,可以表达为lambda演算式)