HBase之BlockCache

zincooo

于 2023-11-21 22:39:28 发布

阅读量364

点赞数

分类专栏： HBase 文章标签： hbase 大数据 BlockCache

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zincooo/article/details/134422273

版权

HBase 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

目录

BlockCache

BlockCache

用于缓存从hdfs读的数据，有两种不同的实现，LruBlockCache(利用堆内存)和BucketCache(利用非堆内存)

LruBlockCache

使用LRU算法

Single access级：首次从hdfs中读取的block位于该层级，后续也会首先考虑驱逐
Multi access级：在single access中的block再次被访问则位于该层级，则block将会升级到该层级。
In-memory access：如果列族配置了in-memory，则不考虑访问次数，直接处于该层级

处于用户block，还缓存

Catalog Tables：即hbase:meta表
HFiles Indexes：用于搜索hfile时无须读取整个数据文件。索引的大小受块大小、键大小和数据大小决定
Keys：row key, family qualifier, and timestamp
Bloom Filters：布隆过滤器

BucketCache

BucketCache是通过CombinedBlockCache来联合管理的：

使用LruBlockCache缓存index和bloom，数据block存储在BucketCache。
BucketCache块缓存可以在堆外、文件或mmaped文件模式下。通过hbase.bucketcache.ioengine参数设定。

配置方法

在hbase-env.sh中先配置堆外内存HBASE_OFFHEAPSIZE(比想要的值大，还有其他使用堆外的地方)
配置相关参数：缓存模式hbase.bucketcache.ioengine、lru缓存大小hfile.block.cache.size、bucketcache缓存大小hbase.bucketcache.size

Compressed BlockCache

hbase.block.data.cachecompressed设置为true启用。提高吞吐，同时也会提高延迟和gc、cpu使用。

注意点

某些情况下不适合使用blockcache：

完全随机读模式：数据短时间内不会访问第二次，此时在表上设置块缓存非常浪费。
大数量的scan，此时可能会导致oom发生
在一个典型的MapReduce作业中每一行只读取一次，因此不需要将它们放入块缓存。Scan对象可以通过setCacheBlocks方法（将其设置为false）禁用此选项。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HBase之BlockCache

hbase读之BlockCache
复制链接

扫一扫

专栏目录

zincooo CSDN认证博客专家 CSDN认证企业博客

码龄6年

69: 原创

29万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

958: 积分

185: 粉丝

254: 获赞

11: 评论

269: 收藏

私信

关注

热门文章

分类专栏

HDFS 9篇
Mac
线上问题 8篇
Linux 3篇
Kafka 1篇
Spark 2篇
Kyuubi 1篇
YARN 6篇
HBase 7篇
Ceph 2篇
LeetCode
Docker 2篇
Mysql 23篇
Presto 1篇
Nginx 3篇

最新评论

上传文件报错Failed to read expected SASL data transfer protection handshake from client
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
上传文件报错Failed to read expected SASL data transfer protection handshake from client
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
beeline连接报错Required field ‘client_protocol‘ is unset
weixin_48303400: 那怎样查看客户端和服务端使用的jar包版本呢，并且怎样替换呢
HDFS之联邦
CSDN-Ada助手: 恭喜您在博客上发布了第17篇关于“HDFS之联邦”的文章！您的持续创作真是令人佩服。通过这篇博客，您对HDFS联邦的介绍非常详细，让读者更好地了解了这个主题。我特别欣赏您对HDFS联邦的深入研究和精确的描述。对于下一步的创作建议，我想提议您可以进一步探讨HDFS联邦在大规模数据处理中的实际应用案例。通过分享实际经验，读者将更好地了解如何在现实场景中使用HDFS联邦来解决问题。同时，您还可以考虑介绍一些与HDFS联邦相关的最佳实践和技巧，以帮助读者更好地应用这一技术。再次恭喜您的连续创作，期待您未来更多精彩的博客！请继续保持谦虚的态度，我们都期待着您的新作品。
HDFS之ViewFS
CSDN-Ada助手: 恭喜您撰写了第18篇博客，题为“HDFS之ViewFS”。您的持续创作真令人钦佩！这篇博客内容丰富，标题也很吸引人。对于HDFS之ViewFS的介绍和解释非常清晰，让读者能够更好地理解和应用该技术。在下一步的创作中，我谦虚地建议您可以考虑添加一些实际应用案例或者深入探讨ViewFS在大数据领域中的潜力和局限性。这样的话，读者们将能更好地将理论知识与实践相结合，进一步提升他们的技术水平。再次恭喜您，并期待您的下一篇博文！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。