Order-Preserving Key Compression for In-Memory Search Trees

本文介绍了一种名为HOPE的高效编码器,专为内存搜索树设计,通过基于字典的熵编码方法实现低查询延迟和高内存效率。通过理论模型指导和多种编码方案的选择,HOPE在B+树等数据结构上展现优异性能。
摘要由CSDN通过智能技术生成

本文提出一种用于内存搜索树的高速保序编码器(HOPE)。HOPE是一个基于字典的快速压缩器,可以对任意键进行编码,同时保留它们的顺序。HOPE的方法是在细粒度上识别常见的关键模式,并利用熵来实现小字典的高压缩率。本文首先建立了一个理论模型来推理保序字典设计。然后选取了六种具有代表性的基于该模型的压缩算法进行实现。这些方案在压缩率和编码速度之间做出了不同的权衡。我们在数据库中使用的五种数据结构:SuRF、ART、HOT、B+树和Prefix B+树上对HOPE进行了评估。我们的实验表明,对于大多数字符串关键工作负载,使用HOPE可以使搜索树同时实现更低的查询延迟(降低40%)和更好的内存效率(减少30%)。

方法:

本文提出高速保序编码器(HOPE),一种基于字典的键压缩器,用于内存搜索树(例如B+树,tries)。HOPE包含六种熵编码方案,在压缩率和编码性能之间进行权衡。当DBMS创建一个基于树的索引/过滤器时,HOPE会对初始批量加载的键进行采样,并统计按方案指定的字节模式的频率。它使用这些统计信息来生成符合我们的理论模型的字典符号,以保持键顺序。然后,HOPE使用定长编码或最优保序前缀编码对这些符号进行编码。HOPE的一个关键见解是它强调编码速度(而不是解码),因为我们的目标搜索树查询不需要重建原始键。 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值