本文参考:王昊奋《知识图谱》
目录
7、其他知识表示方法:Json-LD、RDFa、HTML5 MicroData
Json-LD(JavaScript Object Notation for Linked Data)
RDFa(Resource Description Framework in attributes)
早期知识表示
1、 一阶谓词逻辑(First-Order Logic)
-
Horn逻辑:一阶谓词逻辑的子集
p(t1,t2....,tn)
p:谓词,n:目(项),ti:变量或常量
eg: has_child(Helen,Jack)
-
描述逻辑:一阶谓词逻辑的可判定子集
O:=<T,A>
T即Tbox,包含内涵知识,描述概念的一般性质。因为概念直接存在包含关系,所以Tbox知识形成类似格的结构。
TBox语言:引入概念以及关系的名称
A即Abox,包含外延知识(断言知识),描述论域中的特定个体。
ABox语言:概念断言:表示一个对象是否属于某个概念;Mother(Helen),Person(Jack)
关系断言:表示两个对象是否满足一定的关系;has_child(Helen,Jack)
2、产生式系统
产生式模型:
其中,P是产生式的前提,Q是一组结论或操作,CF (Certainty Factor)为确定性因子,也称置信度。
谓词逻辑中的规则与产生式的基本形式相似,事实上,蕴涵式只是产生式的一种特殊情况。
理由如下:
谓词逻辑规则只能表示精确知识,其值非“真”即“假”,而产生式不仅可以表示精确知识,而且还可以表示不精确知识;即用产生式表示知识的系统中,“事实”与产生式的“前提”中所规定的条件进行匹配时,可以是“精确匹配”,也可以是基于相似度的“不精确匹配”,只要相似度落入某个预先设定的范围内,即可认为匹配。但对谓词逻辑的规则而言,其匹配必须是精确的。
eg: IF 本微生物的染色斑是革兰氏阴性
本微生物的形状呈杆状 病人是中间宿主
THEN 该微生物是绿脓杆菌,置信度CF=0.6
3、 框架
框架基本组成:
框架:是一种描述对象 (事物、事件或概念等)属性的数据结构,在框架理论中,框架是知识表示的基本单位。
一个框架由若干个“槽” (Slot)结构组成,每个槽又可分为若干个“侧面” 。
- 一个槽:用于描述所论对象某一方面的属性;
- 一个侧面:用于描述相应属性的一个方面。
- 槽和侧面所具有的属性值分别称为槽值和侧面值。
框架的示例:
4、语义网络(Semantic Network)
- 语义网络中的节点:表示各种事物、概念、情况、属性、动作、状态等,每个节点可以带有若干属性,一般用框架或元组表示。此外,节点还可以是一个语义子网络,形成一个多层次的嵌套结构。
- 语义网络中的弧:表示各种语义联系,指明它所连接的节点间某种语义关系。
- 节点和弧都必须带有标识,以便区分各种不同对象以及对象间各种不同的语义联系。
- 最简单的语义网络是一个三元组:(节点1,弧,节点2)
基于语义网的知识表示框架
(1)RDF与RDFS
RDF(Resource Description Framework):
- R可以代表页面、图片、视频等任何具有URI(Universal Resource Identifiers)的标识符
- D代表属性、特征和资源之间的关系
- F代表模型、语言和这些描述的语法
RDF模型:
RDF中知识以三元组(triple)的形式出现,每一知识可以被分解为:(subject(主),predicate(谓),object(宾))
如:(合肥,坐落于,安徽)
RDF同时也是一种用来连接资源的描述的图模型,三元组可以表述为:(vertex,edge,vertex),同时在RDF中资源和属性都可以被URI唯一标识。
CCF ADL邀请王昊奋作为讲者,演讲主题为知识图谱。
两个三元组为:(CCF ADL, speaker, Haofen),(CCF ADL, theme, KG)
这两个三元组可以使用表示为如下图模型:
我们还可以将命名空间定义为前缀,如定义为ex-schema来简化图形,则得到如下图:
RDF中的属性值同时也可以是一个文字,如字符串/数值(它们不是一个Resource)。
如将上述例子的三元组改为(CCF ADL, theme, ‘KG’),那么这里的KG将不是一个资源或属性,而是一个属性的值,此时图模型表示如下(注意图中的方框):
RDF中的属性的文字值同时可以使一个XML datatype类型。
RDF空白结点:
RDF允许存在匿名的资源,它可以作为连接其他非匿名资源的桥梁,此时RDF中会出现空白结点,因为这个资源不被URI表示,所以可以表示为 _:xyz。
例子:Haofen是某一次KG讲座的讲者。这表示意味着CCF ADL讲座至少有一位讲者,可以表示为如下2跳相连图:
上述例子说明:一个三元组的缺失并不是什么大事情。
RDF分布式的定义与合并知识:
我们可以分布式定义知识:
接着我们可以