参考论文:知识图谱构建技术综述-秦志光等人
概述
语义网络是一张数据构成的网络,语义网络技术向用户提供的是一个查询环境,其核心要义是以图形的方式向用户返回经过加工和推理的知识。
而知识图谱技术则是实现智能化与意见所的基础和桥梁。传统的信息检索方式已经很难满足人们全面掌握信息资源的需求。知识图谱技术的出现为解决信息检索问题提供了新的思路。
定义
知识图谱是谷歌用于增强其搜索引擎功能的辅助知识库。
- 知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是"实体-关系-实体"三元组,以及实体及其相关属性的值对。实体间通过关系相互联结,构成网状的知识结构。(1)知识图谱是对物理世界的一种符号表达(2)知识图谱的研究价值在于,以最小的代价将互联网中积累的信息组织起来,成为可以被利用的知识(3)知识图谱的应用价值在于,它能改变现有的信息检索方式。相比字符串模糊匹配的方式而言,以图形化方式向用户展示经过分类整理的结构化知识更加方便获取自己想要的答案。
- 知识图谱的架构,包括知识图谱自身的逻辑结构以及构建知识图谱所采用的技术架构。逻辑上知识图谱被划分为2个层次:数据层和模式层。在数据层知识以事实(fact)为单位存储在图数据库。模式层在数据层之上,是知识图谱的核心。模式层存储的是经过提炼的知识。
- 构建知识图谱分为自顶向下构建和自底向上构建。自顶向下构建指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库。自底向上构建是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择置信度较高的新模式,人工审核后加入到知识库中。
构建技术
一般采