论文阅读（２）：ｈａｓｈｋｖ

最新推荐文章于 2021-11-05 18:57:18 发布

bigbugss

最新推荐文章于 2021-11-05 18:57:18 发布

阅读量991

点赞数

分类专栏：键值存储

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bigbugss/article/details/82970369

版权

键值存储专栏收录该内容

10 篇文章 1 订阅

订阅专栏

香港中文大学ｈｅｌｅｎ　HashKV: Enabling Efficient Updates　in KV Storage via Hashing

针对问题：ｋｖ分离设计中，ｖａｌｕｅｌｏｇ的ｇｃ的效率低下，尤其在ｕｐｄａｔｅ　ｉｎｔｅｎｓｉｖｅ负载中。

第一：环形日志维持严格ＧＣ顺序，总是在最近的ｋｖ对插入的位置开始进行ＧＣ。会造成不必要的数据移动。

第二：ｇｃ需要查询ＬＳＭ来检查ｋｖ的有效性，而这个查询有着很高的延迟。

ｈａｓｈｋｖ的解决方法：

１．对ｖａｌｕｅ　ｓｔｏｒａｇｅ进行基于ｈａｓｈ的数据分组设计。将ｖａｌｕｅ　ｓｔｏｒａｇｅ分成固定大小的分组，每个新插入的ｋｖ对根据ｈａｓｈ值选择ｇｒｏｕｐ进行ａｐｐｅｎｄ。

并在此基础上，提出了三点扩展：

动态的保留空间分配：如果原始的ｈａｓｈ分组满了，动态的分配保留空间给额外的ｗｒｉｔｅ

热点感知：分离ｈｏｔ和ｃｏｌｄ的键值对来提高ｇｃ效率。

选择性的ｋｖ分离：！！！！小ｓｉｚｅ的ｋｖ对完全保留在ＬＳＭｔｒｅｅ来简化查询。

实验，对ｌｅｖｅｌｄｂ，ｒｏｃｋｓｄｂ，ｋｖｓｅｐｅｒａｔｉｏｎ进行了对比，在ｌｏａｄ和ｕｐｄａｔｅ两种数据ｓｃｈｅｍｅ下，ｗｉｓｃｋｅｙｄｂ在ｕｐｄａｔｅ表现的很差。

ＳＳＤ分组，ｈｏｔ　ｋｖ对会进行更多ｇｃ，相应他们在ｌｓｍｔｒｅｅ也在更上层，查询更少。

ｈａｓｈｋｖ设计：

１．基于哈希的数据分区：分区隔离，使得一个ｋｅｙ的所有ｕｐｄａｔｅ都在一个分区里。确定性分区，一个ｖａｌｕｅ应该被存储的分区由ｈａｓｈ决定。

２．动态保留空间的分配，每个分区大小固定，有些分区可能增长的超出了这个限制，这时就分配保留空间给他。

３．热点感知：很多时候，热点数据和冷数据被分配到一个分区，那么对这样分区的垃圾回收会导致冷数据被反复重写。ｈａｓｈｋｖ通过标签技术将冷热数据分开。

４．选择性的ｋｖ分离：比较小的ｖａｌｕｅ就不适用ｋｖ分离的机制。

ｇｃ策略：

选择那个ｓｅｇｍｅｎｔｇｒｏｕｐ进行ｇｃ？

目前是贪婪算法，最多写操作的一个ｇｒｏｕｐ

怎么尽快判断一个ｋｖ对是否ｖａｌｉｄ？

将ｋｅｙ，ｍｅｔａ和ｖａｌｕｅ一起存在ｖａｌｕｅｌｏｇ中，这样就不用去ＬＳＭｔｒｅｅ里去找，直接通过ｓｃａｎ　ｖａｌｕｅｌｏｇ的对应ｇｒｏｕｐ就能知道。与ｇｒｏｕｐ　ｅｎｄ离得最近的一个版本的ｋｖ对必然是最新的。

热点感知：

标签技术，对ｓｅｇｇｒｏｕｐ中每个ｋｖ　ｐａｉｒ进行ｈｏｔ、ｃｏｌｄ分类

当前方法：上次插入之后至少ｕｐｄａｔｅ过一次的叫做热数据，热数据还存在ｓｅｇｇｒｏｕｐ，但冷数据就只将ｍｅｔａ放在ｇｒｏｕｐ里，而将ｋｖ放在另外的存储空间，并用ｔａｇ标示，等以后被更新过，在更新为热数据。而对于ｃｏｌｄｄａｔａ的ｖｌｏｇ的垃圾回收，就执行ｗｉｓｃｋｅｙｄｂ的ｖｌｏｇ　ｇｃ方法。

选择性的键值分离：

我当初的想法和他一致

范围查询：

使用ＬＳＭｔｒｅｅ的关键因素，键值在ｓｓｔａｂｌｅ中都是有序排列的。类似ｗｉｓｃｋｅｙｄｂ，通过ｐｒｅｒｅａｄ策略，减少范围查询的延迟，将值预取到ｐａｇｅｃａｃｈｅ中。

崩溃一致性：

元数据日志，ｆｌｕｓｈ写缓存，ｇｃ

元数据日志是用来记录每一次ｆｌｕｓｈ操作的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文阅读（２）：ｈａｓｈｋｖ

香港中文大学ｈｅｌｅｎ　HashKV: Enabling Efficient Updates　in KV Storage via Hashing 针对问题：ｋｖ分离设计中，ｖａｌｕｅｌｏｇ的ｇｃ的效率低下，尤其在ｕｐｄａｔｅ　ｉｎｔｅｎｓｉｖｅ负载中。第一：环形日志维持严格ＧＣ顺序，总是在最近的ｋｖ对插入的位置开始进行ＧＣ。会造成不必要的数据移动。第二：ｇｃ需要查询ＬＳＭ来检查ｋｖ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。