(一)知识图谱本体建模之RDF、RDFS、OWL详解
1.语义网体系
知识图谱于2012年由Google提出,并不是新概念,而是由语义网络(Semantic Network)衍生而来。语义网络由相互连接的节点和边组成,节点表示概念或者对象,边表示他们之间的关系。RDF,RDFS与OWL都是基于语义网的知识表示框架,在节点和边的取值上做了约束,制定了统一标准,为多源数据的融合提供了便利。RDF,RDFS/OWL 属于语义网技术栈,它们的提出,使得语义网克服了语义网络的缺点。其语义网技术栈如下所示。
2.RDF 表现形式
RDF(Resource Description Framework),即资源描述框架,其本质是一个数据模型(Data Model)。
具体地,
Resource:页面、图片、视频等任何具有URI标识符的资源。
Description:属性、特征和资源之间的关系。
Framework:模型、语言和这些描述的语法。
它提供了一个统一的标准,用于描述实体/资源。RDF 形式上表示为 SPO 三元组,有时候也称为一条语句(statement),知识图谱中我们也称其为一条知识(subject, predicate, object ),如下图所示,其节点表示实体/资源、属性,边则表示了实体和实体之间的关系以及实体和属性的关系。
3.RDF序列化方法
若需要对RDF数据进行传输和存储,则需要对RDF数据进行序列化(Serialization)。目前,RDF 序列化的方式主要有:RDF/XML,N-Triples,Turtle,RDFa,JSON-LD等几种。
-
RDF/XML,就是用 XML 的格式来表示 RDF 数据。之所以提出这个方法,是因为 XML 的技术比较成熟,有许多现成的工具来存储和解析XML。然而,对于 RDF 来说,XML 的格式太冗长,也不便于阅读,通常我们不会使用这种方式来处理 RDF 数据。
-
N-Triples,即用多个三元组来表示 RDF数 据集,是最直观的表示方法。在文件中,每一行表示一个三元组&