hbase+hadoop运维的一点经验

最新推荐文章于 2022-01-04 14:53:50 发布

bluekeyv

最新推荐文章于 2022-01-04 14:53:50 发布

阅读量4.8k

点赞数 2

分类专栏： hadoop hbase 文章标签： hbase hadoop mapreduce 网络测试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kirayuan/article/details/6832377

版权

hbase 同时被 2 个专栏收录

31 篇文章 1 订阅

订阅专栏

14 篇文章 0 订阅

订阅专栏

目前系统上线，不断的有新问题，也不断的在总结一些经验，发在这里，做下mark，同时也为hbase使用者提供一些思路吧。

1、单条rowkey下虽然能支持百万列，但是建议不要这么做，因为真正一个rowkey下挂了这么多数据时会在两个地方出现问题，一是查询时单行记录数据量过大，client超时；第二个问题是regionserver做compact的过程有可能被单条rowkey的数据塞满内存造成OOM

2、datanode的handler的数量不要默认值，太少，要在100左右，另外regionserver的handler的数量在200左右比较合适

3、resultScannser使用完毕记得关闭

4、HTablePool可以管理HTable。查询结束后直接用HTablePool.put(HTable t)来回收，入库结束后记得table.flushCommit()后再回收

5、mapred.local.dir这个参数是mapreduce会在机器的硬盘上做临时文件的存放，如果挂载的多块盘请将每个盘都配上，提升总体性能

6、map阶段的输出可以配置LZO压缩，这样能有效节省map->reduce阶段的网络带宽，不过会提高cpu的占用率

7、多网卡绑定能有效提高hadoop体系的网络带宽

8、bulkload目前测试的性能在单节点51GB/小时左右，希望其他有做过的同学能交流一下bulkload方面的问题。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
hbase+hadoop运维的一点经验

目前系统上线，不断的有新问题，也不断的在总结一些经验，发在这里，做下mark，同时也为hbase使用者提供一些思路吧。1、单条rowkey下虽然能支持百万列，但是建议不要这么做，因为真正一个rowkey下挂了这么多数据时会在两个地方出现问题，一是查询时单行记录数据量过大，cl
复制链接

扫一扫

专栏目录

博客等级

码龄16年

72
原创

24
点赞

37
收藏

201
粉丝

关注

私信

热门文章

分类专栏

技术感悟 1篇
hadoop 14篇
hbase 31篇
hive 3篇
java 14篇
linux 7篇
mapreduce 5篇
nosql 12篇
web技术 10篇
数据库技术 8篇
算法 3篇
solr 1篇
大数据云计算 2篇
实时计算 1篇
kudu 1篇

最新评论

hadoop2.0 HDFS搭建和HA切换
lmw0320: 1L代表什么意思呢？求指点。。
mapreduce中控制mapper的数量
一只懒得睁眼的猫: 看完作者写的，感觉写的有点不太对：splitSize = Math.max(minSize, Math.min(maxSize, blockSize))，如果输入文件size巨大，但不是小文件，如果想减少mapper任务的数量，可以通过增加mapred.max.split.size的数值，而不是增大mapred.min.split.size的值
java快速计算文本文件行数
江小白写bug: 少了一行，比正确的行数少一行
Hbase几种数据入库（load）方式比较
小强签名设计: 用mapreduce入库的时候不应该调用的是Tableoutputformat类吗，我看博主的代码好像没有用这个类啊。我想问问Tableoutputformat和HTable.put(put)有什么联系吗？
hbase二级索引
THECHINALION: 讲得非常好，谢谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。