Order-Preserving Key Compression for In-Memory Search Trees

西西弗的小蚂蚁

已于 2024-04-16 09:52:10 修改

阅读量6

点赞数

分类专栏：范围过滤查询局部敏感哈希布隆过滤器文章标签：数据库

于 2022-10-06 21:18:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zj_18706809267/article/details/127187575

版权

Order-Preserving Key Compression for In-Memory Search Trees

本文提出一种用于内存搜索树的高速保序编码器(HOPE)。HOPE是一个基于字典的快速压缩器，可以对任意键进行编码，同时保留它们的顺序。HOPE的方法是在细粒度上识别常见的关键模式，并利用熵来实现小字典的高压缩率。本文首先建立了一个理论模型来推理保序字典设计。然后选取了六种具有代表性的基于该模型的压缩算法进行实现。这些方案在压缩率和编码速度之间做出了不同的权衡。我们在数据库中使用的五种数据结构:SuRF、ART、HOT、B+树和Prefix B+树上对HOPE进行了评估。我们的实验表明，对于大多数字符串关键工作负载，使用HOPE可以使搜索树同时实现更低的查询延迟(降低40%)和更好的内存效率(减少30%)。

背景：

压缩是减少DBMS搜索树内存消耗的一种明显方法。压缩提高了搜索树的缓存性能，并允许DBMS在内存中保留更多的数据以进一步减少I/ o。系统必须平衡这些性能提升与压缩算法的额外计算开销

第一种是使用Snappy[9]和LZ4[7]等算法对树页面进行面向块的压缩。这种方法对基于磁盘的树是有益的，因为它最小化了磁盘和内存之间的数据移动。

第二种方法是设计一种内存高效的数据结构，避免存储不必要的关键信息

方法：

本文提出高速保序编码器(HOPE)，一种基于字典的键压缩器，用于内存搜索树(例如B+树，tries)。HOPE包含六种熵编码方案，在压缩率和编码性能之间进行权衡。当DBMS创建一个基于树的索引/过滤器时，HOPE

最低0.47元/天解锁文章

西西弗的小蚂蚁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Order-Preserving Key Compression for In-Memory Search Trees

我们的实验表明，对于大多数字符串关键工作负载，使用HOPE可以使搜索树同时实现更低的查询延迟(降低40%)和更好的内存效率(减少30%)。给定源字符串src，可以在字典中查找src，得到一个条目(s→c)∈D, s∈s, c∈c，使得s是src的前缀，即src = s·srcsuffix，其中“·”为拼接操作。使用字符串轴模型，我们可以构建广泛的基于字典的压缩方案，以服务于我们的目标应用程序(即内存搜索树的键压缩)。HOPE是一个基于字典的快速压缩器，可以对任意键进行编码，同时保留它们的顺序。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。