【知识图谱学习笔记】02 知识图谱基础

本文介绍了知识图谱的基础,包括RDF、RDFS和OWL的知识表示,SPARQL查询语言,以及数据提升标准RDB2RDF和GRDDL。RDF用于描述实体,RDFS提供简单的模式化,OWL则为构建本体提供更强大工具。SPARQL用于查询RDF数据。数据提升标准如RDB2RDF将关系数据转换为RDF格式,GRDDL将XML数据转换为RDF。
摘要由CSDN通过智能技术生成

这部分将会介绍有关知识图谱的相关概念以及基本的要素。包括本体关系,在本体内定义的被广泛使用词汇,以及将其他格式的数据转换为知识图谱的一些标准。

2.1 知识表示和查询语言

知识表示和推理术语AI领域,是用来以格式化的形式来表示世界上的知识,并且允许计算机能够根据相关信息完成自动推理,以达到决策支持的目的。正如在01的简介中提到的,知识图谱可以被视为是语义网在现代的一种知识推理变体。

知识图谱是一系列实体类型,这些实体有自己的属性,并且实体之间还有定义的关系类型。实体的类型与关系在关系中被定义为本体,这种定义方式被称为词典。在这个部分我们会介绍用来表示知识图谱的RDF,用来定义本体的RDFS和OWL以及一些用来知识图谱查询的标准。

2.1.1 RDF和RDFS

RDF
RDF用来描述实体,在W3C中是一种资源。RDF可以被定义为任何东西,例如一个人、一个网页或者一个巨大的恐龙。一个知识图谱由一个三元组组成,并且这个三元组是一个有向图,在RDF中有三种类型的节点,国际资源定位符(Internationalised Resource Identifiers),也称IRI,字面量或者空节点。如图所示
在这里插入图片描述
在一个三元组中:

  • 主语可以是一个IRI或者空节点
  • 谓语应该是一个IRI
  • 宾语可以是一个IRI,字面量或者空节点

RDF图中的IRI可以唯一界定一个资源,IRI是更加一般化的URLs。它允许使用更多的符号。字面量Literals可以取值为字符串、数字以及日期。RDF中的字面量通常有两种或者三种元素组成:

  • 一种词汇形式
  • IRI数据类型
  • 一个非空的语言标签

空节点是从IRIs和literals中分离出来的,或者说,一个空节点是任意的量,在RDF中空节点可以表示一些IRIs和literals不能表示的量,例如

  • 描述一个具有多个成分的结构,例如RDF
  • 描述一个具体化的内容,例如来源信息
  • 表示一个没有显式命名的节点
  • 对内部的信息的一种保护,例如保护浏览器用户的一些隐私信息

IRIs通常以一个命名空间作为开头,一些命名空间为了方便表示会和一些更短的前缀关联,这种前缀如下表示:
————————————————————————————
prefix dbpedia : http://dbpedia.org/resource/
prefix dbpedia-owl : http://dbpedia.org/ontology/
prefix xsd : http://www.w3.org/2001/XMLSchema#
————————————————————————————
和典型的语义网络不一样的地方在于,RDF有一些语言级别预定义的属性,比如rdf:type,它是用来对资源进行分类的,和语义网络中的is-a关系所对应。

序列化RDF
RDF为知识图谱提供了标准的数据模型,RDF数据的存储和交换有许多序列化方法,比如Turtle,RDF/XML,RDFa,B-Triples,NQUADS,JSON-LD等

RDFS
RDFS为RDF提供了简单的模式化语言,并且允许用户使用一些预定义语言类rdfs:Class/property rdfs:Property来声明一个类或属性,例如下面的例子分别将org:Organization声明为一个类,org:hasHomePage声明为一个属性
————————————————————————————
org:Organization rdf:type rdfs:Class.
org:Start-up a rdfs:Class.
org:hasHomePage rdf:type rdfs:Property.
————————————————————————————
除此之外,RDFS还提供:
rdfs:subClassOf【子类】
rdfs:subPropertyOf【子属性】
rdfs:domain【谓语适用的主语范围】
rdfs:range【数据类型】
这里需要说明的是,RDF作为一个模式语言,有很多局限性:

  1. RDF不支持否定功能;例如我们在RDF中可以表达:ESI是一个SME,但是不能表达ESI不是一个人
  2. RDFS不能去定义一个类;例如我们在R
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值