Adaptive Distributed RDF Graph Fragmentation and Allocation based on Query Workload

本文探讨了一种自适应的RDF图分段和分配策略,以反映查询工作负载的特性,同时确保数据完整性和近似比。研究中提出了基于局部模式的碎片化策略,通过挖掘频繁访问模式(FAP),实现垂直、水平和混合分段。分段后,采用亲和度度量来优化碎片分配,减少跨站点连接,提高查询性能。此外,文章还介绍了如何维护FAP树以适应工作负载变化,并提出推送跨片段连接优化方法,降低查询评估成本。
摘要由CSDN通过智能技术生成

本文由学者Peng Peng,Lei Zou,Lei Chen和Dongyan Zhao于2019.4在《IEEE Transactions on Knowledge and Data Engineering》联合发表
原文下载链接文末自取

在《Query Workload-based RDF Graph Fragmentation and Allocation》中研究了分段和分配策略,本文自适应地维护频繁访问模式(FAP)反映工作负载的特征,同时确保数据完整性和近似比。由于评估SPARQL查询有较强局部性的子图(同态)匹配,提出了基于局部模式的碎片化策略,首先,在查询工作负载中挖掘和选择频繁子图模式(频繁访问模式FAPs),然后提出三种分段策略:垂直,水平和混合分段,满足不同类型的查询处理目标的同时划分RDF图。分段后,再在平衡碎片的同时将碎片分配到各个站点。

分段和分配
工作重点是RDF存储库的“数据碎片和分配”,而提议的碎片是基于挖掘的频繁模式。通过利用分布式关系数据库设计的经验,分开分布式设计,更好处理问题。
分段
在这里插入图片描述
分配:给定碎片F,然后在不同的站点间分配碎片。 在这里插入图片描述
给定RDF图G,查询工作负载Q和由站点S组成的分布式系统,目标是首先将G分解为碎片F,然后找到F到S的分配A。大多数SPARQL查询都使用一些频繁的RDF属性,所有属性分为以下两类:
在这里插入图片描述
在不同站点之间划分具有频繁属性的边,可提高查询性能。收集RDF图中所有不频繁边形成冷图。任何现有方法均用于冷图,但此研究仅在评估SPARQL查询时才使用冷图,如图为系统架构:
在这里插入图片描述
离线阶段:在工作负载中挖掘和选择一些FAP。 还要维护和更新选定的FAP集,适应工作量的变化。 然后,基于选择FAP,提出三

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值