导读:知识图谱的概念诞生于2012年,由Google公司首先提出。知识图谱的提出是为了准确地阐述人、事、物之间的关系,最早应用于搜索引擎。知识图谱是为了描述文本语义,在自然界建立实体关系的知识数据库。一般情况下,我们可以使用关系图来表示知识图谱。
作者:刘宇 赵宏宇 刘书斌 孙明珠
来源:大数据DT(ID:hzdashuju)
01 什么是知识图谱
我们可以从不同的视角去审视知识图谱的概念。
在Web视角下,知识图谱如同简单文本之间的超链接一样,通过建立数据之间的语义链接,支持语义搜索。
在自然语言处理视角下,知识图谱就是从文本中抽取语义和结构化的数据。
在知识表示视角下,知识图谱是采用计算机符号表示和处理知识的方法。
在人工智能视角下,知识图谱是利用知识库来辅助理解人类语言的工具。
在数据库视角下,知识图谱是利用图的方式去存储知识的方法。
目前,学术界还没有给知识图谱一个统一的定义。在谷歌发布的文档中有明确的描述,知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法。
知识图谱还是比较通用的语义知识的形式化描述框架,它用节点表示语义符号,用边表示语义之间的关系,如图3-1所示。在知识图谱中,人、事、物通常被称作实体或本体。
▲图3-1 知识图谱示例
知识图谱的组成三要素包括:实体、关系和属性。
实体:又叫作本体(Ontology),指客观存在并可相互区别的事物,可以是具体的人、事、物,也可以是抽象的概念或联系。实体是知识图谱中最基本的元素。
关系:在知识图谱中,边表示知识图谱中的关系,用来表示不同实体间的某种联系。如图3-1所示,图灵和人工智能之间的关系,知识图谱和谷歌之间的关系,谷歌和深度学习之间的关系。
属性: