之前做了个知识图谱的调研,正好回答这个问题。阿力阿哩哩:知识图谱调研zhuanlan.zhihu.com
1. 知识图谱与数据库
主要有两种数据库RDF数据形式的三元组库:基于关系存储的数据库代表为Oracle 12C + 图数据扩展组件,能管理高达1.08万亿个三元组信息
属性图数据形式的图数据库:基于属性图存储的图数据库代表为Neo4j,目前还不支持管理三元组,但有向这方向演化的技术趋势
大的技术趋势:三元组库和图数据库的相互融合发展
2. 知识图谱与智能问答
定义:依托一个大型知识库(知识图谱),将用户的自然语言处问题转化成为结构化查询语句(如SQL),直接从知识库中导出答案。
知识问答重心聚焦于事实型问答,问题答案是一个实义词or实义短语。如“中国的首都在哪?”“北京。”
事实型问题类型区分按问题类型分:单知识点问题与多知识点问题。
按问题领域分:垂直领域和通用领域,其中垂直领域的知识图谱小,精度更好,问答质量更容易提升。
(1)第一种技术方向:攻克知识问答的技术关键是理解用户的问句,当前有三种技术
① 大部分先进的问答系统是基于语义解析,目的是将自然语言问句转化成结构化的查询语句如SQL,不过需要大量的人工标注数据做监督学习。
② 基于信息检索的方法可以回避需要大量人工标注数据的问题,根据粗粒度检索信息,在知识库中选出候选答案,并根据问题特征进行排序,返回最佳答案给用户为了实现有效的基于检索信息的问答,让机器理解用户问题&#