RDF-3X: a RISC-style Engine for RDF

RDF-3X是一个基于RISC风格的RDF数据存储和查询引擎,它提供了通用的解决方案,无需物理设计调整。通过精细的数据结构和索引,RDF-3X实现了高效的查询处理,特别是优化了连接顺序。其特点包括三元组的压缩存储、聚合索引和基于统计的成本模型进行查询优化。此外,RDF-3X支持SPARQL查询,并能处理复杂的查询模式,如星形和链形连接。
摘要由CSDN通过智能技术生成

本文由学者Thomas Neumann和Gerhard Weikum共同发表

本文介绍SPARQL的RDF-3X引擎,通过采用精简的体系结构和精密的数据结构和操作实现RISC的体系结构,获得出色的性能。RDF-3X的要点:1、通用的解决方案用于存储和索引RDF,RDF无需要物理设计调整;2、强大简单的查询处理器,利用快速合并连接可能的最大范围;3、查询优化器,对整个连接路径使用基于统计概要的成本模型选择最佳连接顺序。

每个连接点对应一个连接,整个查询可看成是RDF数据图中需要匹配的模式。在SPARQL中,谓词可为变量或通配符,允许与模式无关的查询。通过将具有相同属性名的三元组分组到属性表中,将它们映射到列存储并为频繁连接创建具体化的视图实现良好的性能。管理大规模RDF数据的技术挑战包括存储布局,索引编制和查询处理:

  • 缺少全局模式和谓词名称的多样性是物理数据库设计的主要问题。

  • 通过对RDF数据的细粒度建模,具有大量连接的查询将在本质上构成工作负载的很大一部分,但是连接属性的可预测性远远低于关系设置。

  • 作为连接顺序和其他执行计划的优化需要数据统计来选择性估计。

  • RDF使用XML语法,而 SPARQL涉及到类似于XML路径表达式的搜索模式,RDF元组形成图而不是树的集合,这与XML设置很不同。

RDF-3X基于三个关键原则:

  • 通过在“巨大的三元组表”上创建适当索引,使物理设计独立于工作负载。RDF-3X不依赖自动调整向导,但有效消除了物理设计调整的需要。

  • 查询处理器是RISC模式,主要依赖于合并连接而不是排序的索引列表。

  • 查询优

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值