RDF数据模型与知识库(知识图谱)

由于万维网上的信息没有统一的表示方式,这给数据管理带来了困难。如果网络中的资源在创建之初就使用标准的元数据来描述,就可以省去许多的麻烦。其中RDF(资源描述框架)可以同来描述和注解万维网中的资源并向计算机系统提供理解和交换数据的手段。RDF是一种资源描述语言,它受到元数据标准、框架系统、面向对象语言等多方面的影响。RDF其本质是一个数据模型,提供了一个统一的标准,用于描述实体/资源。简单来说,就是表示事物的一种方法和手段。RDF由节点和边组成,节点表示实体/资源和属性,边则表示了实体和实体之间的关系以及实体和属性的关系。于是,基于RDF数据模型,知识图谱由一条条知识组成,每条知识表示为一个SPO三元组。三元组是是 RDF 的核心概念,指的是两个事物和它们之间的关系,在语法上呈现为“主语 + 谓语 + 宾语”。
数据库技术与人工智能技术相结合,出现了智能数据库、知识库和主动数据库系统。其中,知识图谱是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到data级别,聚合大量知识,从而实现知识的快速响应和推理。大部分知识图谱使用RDF描述世界上的各种资源,并以三元组的形式保存到知识库中。知识图谱的构建包括信息抽取、信息融合和信息加工三个步骤。信息抽取是从结构化数据库(关系数据库)、半结构化数据库(XML数据库)中从各种类型的数据源中提取出实体、属性以及实体之间的关系,在此基础上形成本体化的知识表达。信息融合即知识整理,用以消除矛盾和歧义。信息加工让系统能够实现推理和快速的有联系的查询。知识图谱相较于传统数据库具有高效率、可扩展、开放和半结构化的特点:
1. 高效率:关系数据库查询时是通过表,对已存储的海量数据进行优化查询; 而知识图谱的查找模式为从三元组中查找需要的内容。对于多跳查找时,知识图 谱的联系和推理性优于关系数据库的Join操作,所以查询效率会大大提升。
2.半结构化:关系数据库要求严格结构化,一个表通常为多表关系,保证数据 的结构。而知识图谱使用三元组,模式灵活,支持半结构化。
3.扩展性:关系数据库扩展时,需在表上添加属性,还得更新相关索引。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值