知识图谱技术的概念性简述

     知识图谱(Knowledge Graph)技术名字起源于谷歌公司对外披露的少部分技术资料,该技术被谷歌率先提起并将它作为一个辅助知识库用于增强其搜索引擎功能。目前知识图谱的定义不再单单是针对于搜索引擎。

概念:

知识图谱的定义:知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。

知识图谱旨在描述客观的概念实体事件及其之间的关系

  • 概念:人们在认识世界过程中形成的对客观事物的概念化的表示,如:动物、机器、人 等等。
  • 实体:自然世界客观存在的具体事物,如:喜剧演员周星驰、电影喜剧之王、豆浆人账号的主人 等等。
  • 事件:客观世界的活动,如:海啸、地震、火山喷发、飞机飞行 等等。
  • 关系:描述概念、实体、事件之间客观存在的联系,如:喜剧演员周星驰与电影喜剧之王的关系、篮球队员与篮球队的关系、大学生与毕业院校的关系 等等。

其基本组成单位是“实体—关系—实体”三元组和 “实体—属性—值” 对,而实体间通过关系相互连接,形成网状的结构。

如下图所示,便是简单的一个知识图谱,⭕️内是实体或属性,圆圈之间的连线便是关系,实体与属性相连,也可实体与实体相连。

架构:

逻辑架构:分为 数据层 和 模式层。

  • 数据层:知识以事实为单位存储在图数据库。以上述的三元组作为基本表达方式,则图数据库存储的知识将构成关系网络,形成知识图谱。
  • 模式层:处于数据层之上,属于知识图谱核心,模式层存储的是经过提炼的知识,其知识冗余较少。

技术架构:此处只介绍自底向上的构建过程,下图是知识图谱技术架构

 

如上图所示,知识谱图的构建从原始数据出发,采用一系列技术手段从原始书记中提取知识要素(事实),之后将其存入知识图谱的数据层和模式层。上述过程是一个不断更新迭代的过程,每一轮迭代均经过三个阶段:信息抽取、知识融合、知识加工。

  • 信息抽取:从各类数据源中抽取出的实体、概念、属性、关系,在这些数据的基础上形成本体化的知识表达。
  • 知识融合:在获取新的知识之后,需要对其进行整合,用以消除矛盾、歧义,比如某些称号可能对应于不同的实体,对此会产生歧义。
  • 知识加工:对于经过知识融合的新知识,需要经过质量评估之后(部分需要人工参与评估),才能将合格部分加入知识库中。知识库新增数据之后,才可以进行知识推理,拓展现有知识、得到新知识。

应用:

除了改善用户搜索体验外,知识图谱还可应用到语义搜索、知识问答、知识驱动的大数据分析与决策等方面。

学习参考:

[1]刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(03):582-600.

[2]徐增林, 盛泳潘, 贺丽荣等. 知识图谱技术综述[J]. 电子科技大学学报, 2016, 第45卷(4):589-606.

[3]李涓子, 侯磊. 知识图谱研究综述[J]. 山西大学学报(自然科学版), 2017, (3):454-459.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值