目录
本章首先介绍知识图谱存储的数据模型、底层数据库的选型及其区别,然后结合搜索、推荐、业务智能、智能对话等应用介绍知识图谱的服务形式,最后介绍知识图谱的算法和数据质量保障方法。
6.1 知识图谱的存储
6.1.1 数据模型
知识图谱的底层数据抽象模型从分类上来讲,可以认为是图(Graph),由点、边等元素构成;但是在具体的实现细节上又有一些差异。本小节主要介绍知识图谱的底层数据模型,主要包括RDF数据模型和属性图模型,并进行对比分析。
1.RDF数据模型
资源描述框架(RDF)是W3C标准化组织制定并推广的且主要在语义网领域使用的一项标准化的数据模型。RDF是一个定义清晰的标准,用于描述实体和资源,以及各个实体或资源之间的关联关系。当不同的系统交换数据时,即使各方的Schema不尽相同,依然可以使用统一的、可理解的数据格式处理数据。
RDF的主要结构由主谓宾组成,分别表示主语和宾语两个实体,以及两个实体之间的关系,如图6-1所示。其中:
● 主语(Subject)是一个实体,或者说一个资源,使用唯一的URI表示。
● 宾语(Object)可以同样是一个实体,或者是一个文本以表示属性。
● 谓语(Predicate)表示主语和宾语之间的关系。