HBase的一点纪要

最新推荐文章于 2023-12-24 23:24:26 发布

dajuezhao

最新推荐文章于 2023-12-24 23:24:26 发布

阅读量8.5k

点赞数

分类专栏： HBase 文章标签： hbase 集群工具 blog 存储工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dajuezhao/article/details/6658826

版权

HBase 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

本文总结了HBase的一些关键操作和优化建议，包括数据rowkey的设计策略、硬件配置要求、列族管理、SecondaryIndex实现方式、内存与I/O优化、Coprocessors的应用、集群稳定性调整以及数据压缩和工作流工具的使用等。

摘要由CSDN通过智能技术生成

1. 数据rowkey散列方便入库速度提升

2. 一般内存至少配置32G、8核CPU、硬盘不做Raid，系统盘和存储盘分开

3. 10台节点入库一个列族的表request数量应该在20W左右

4. Bulk Load增量效果不一定好，适合第一次数据导入

5. 一个表的列族数量最好控制在4个以内

6. SecondaryIndex一般来说还是采用多表的模式实现

7. URL做rowkey一般来说是用域名或者（IP+时间+域名）

8. SATA硬盘的I/O Wait一般是在15ms以内，如果太高就有可能是内存不够

9. http://hbaseblog.com/2010/11/30/hbase-coprocessors/官方BLOG(值得看)

10. Hbase Coprocessors，Hbase的工具，可以看

11. Hbase的参数调整有利于集群稳定

12. 集群节点的SWAP需要关闭

13. Zookeeper数量一般来说是3个（需要是奇数，选举机制）。1000台的规模配置7个

14. Compact一般来说采用默认值，如果压缩、分表或是Block时间过长，可以调整

15. 数据压缩一般建议采用LZO的方式

16. MR调度工具，Oozie（工作流串线）

17. Lucene的index存放在Hbase中，实现Hbase数据条内的模糊查询

18. Hbase单条数据size最好不要超过2MB

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。