步骤
- 理解问题并将问题结构化表示
用户问题:自然语言
知识图谱的领域知识:结构化的三元组
需要:自然语言->领域知识,建立用户查询和知识图谱中领域知识的匹配关系
解决:将自然语言描述的问题结构化表示
解决方案:自然语言解析器Stanford Parser
,Stanford CoreNLP
- 问题扩展并过滤
用户问题:用户处于不同的领域,对于问题的理解不同。如,果农询问的“苹果多少钱?”与手机卖场人员询问的“苹果多少钱?”,两个都是“苹果”,但是意义相差巨大。
解决:查询扩展,扩展结果过滤
解决方案:基于WordNet
和Microsoft Concept Graph
对结构表示中的概念进行不同语义角度的扩展,基于相似度计算方法Word2Vec
和UMBC
对扩展结果进行过滤。 - 问题与领域知识匹配,并验证结果
关键点
问题理解
需求:将用户的查询转化为一种结构化的表示
表示方法: