前言
知识图谱的表示:指的是用什么语言对知识图谱进行建模,从而可以方便知识计算。从图的角度来看,知识图谱是一个语义网络(一种用互联的节点和弧表示知识的一个结构)
W3C采用了以描述逻辑为逻辑基础的本体语义OWL作为定义Web术语的标准语义,还推出了一种用于表示Web本体的语言RDF Schema(简称RDFS)
目前基于向量的知识表示开始流行,这类表示将知识图谱三元组的主谓宾表示成数值向量,通过向量的知识表示,可以采用统计或神经网络的方法进行推理,对知识图谱中的实体直接的关系进行预测。
1、知识表示
与传统人工智能相比,知识图谱时代的知识表示方法发生了很大的变化。一方面,现代知识图谱收到规模化扩展的影响,通常采用三元组为基础的较为简单使用的知识表示方法,弱化了对强逻辑表示的要求。另一方面,由于知识图谱是很多搜索、问答和大数据分析系统的重要数据基础,基于向量的知识图谱表示使得这些数据更易于和深度学习模型集成。
2、互联网时代的语义网知识表示框架
随着语义网的提出。知识表示迎来了新的契机和挑战,契机在于语义网为知识表示提供了一个很好地应用场景,挑战在于面向语义网的知识表示需要提供一套标准语义可以来描述Web的各种信息。因此W3C提出了新的标准语义RDF、RDFS和OWL两种语言。
2.1、RDF和RDFS
在RDF中,知识总以三元组的形式出现,每一份知识可以被分解为主谓宾形式(subject,predicate,object)。RDF中的谓语是一个属性。属性可以连接两个个体(主语和宾语都是个体)。
RDF用到了类以及属性描述个体之间的关系,这些类和属性由模式(schema)定义。RDF Schema(RDFS)提供了对类和属性的简单描述,从而给RDF数据提供词汇建模语言。
RDFS提供了最基本的对类和属性的描述元语
- rdf:type:用于指定个体的类
- rdfs:subClassOf:用于指定类的父类
- rdfs:subPropertyOf:用于指定属性的父属性
- rdfs:domain:用于指定属性的定义域
- rdfs:range:用于指定属性的值域
## 2.2 OWL和OWL2 Fragments
RDF和RDFS可以表示一些简单的语义,但是更复杂的场景下,RDF和RDFS语义的表达能力显得太弱,还缺少常用的特征: - 1 对于局部值域的属性定义
- 2.类,属性、个体的等价性
- 3.不相交类的定义
- 4.基数约束
- 5.关于属性特性的描述
而OWL很好地解决了以上问题。
3.知识图谱的向量表示方法
知识以基于离散符号的方法进行表达,但这些符号并不能在计算机中表达相应语义层面的信息,也不能进行语义基数,对下游的一些应用不友好。在基于网络结构的知识图谱上进行相关应用是,因为图结构的特殊性,应用算法的使用与图算法有关,相关算法具有较高的复杂度,面对大规模的知识库很难扩展