hbase和hive的一些调优心得

最新推荐文章于 2024-07-16 22:39:54 发布

do_what_you_can_do

最新推荐文章于 2024-07-16 22:39:54 发布

阅读量2k

点赞数

分类专栏： 20161120 文章标签： hive hbase 性能调优

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/do_what_you_can_do/article/details/53241374

版权

本文分享了关于Hive和HBase的性能优化经验，包括Hive的limit开启、严格模式设置、MapReduce优化、本地模式利用、Join策略、推测执行等；HBase查询优化如设置scan缓存、指定查询列、使用过滤器，写入优化如关闭WAL、预创建Region，以及配置参数和表设计的调整，以提升整体系统性能。

摘要由CSDN通过智能技术生成

Hive优化：
1、开启limit，防止过多的数据查询造成时延
2、开启严格模式，禁止三种模式的查询（查询全部分区而没有where限制、使用order by查询而没有limit限制，表联结使用on以限制笛卡儿积的查询）
3、合理的设置map reduce的个数，不能过多或者过少
4、使用本地模式，对于一些数据量小的查询，减少开启job的时间
5、使用map端jion，将数据量小的表，放在join的左边，直接加入内存
6、推测执行，这是对MR的优化，防止出现木桶效应
7、设置并行度，让一些不相关的stage能够并行运行，加速任务的完成
8、JVM重用，通过在配置文件中设置一些参数，来配置某些task的stage重用JVM，减少任务的开启时间
9、建立索引，加快查询
10、调整动态分区的数量，尽量高，不能太高，1000个左右最好
11、设置中间和reduce结果进行压缩，减少占用空间

HBase优化：
1、hbase查询优化

1> 设置scan缓存，定义服务端到客户端的数据条数
2> 显示指定查询列，避免太多的数据传输造成网络压力
3 >设置过滤，只查询需要的数据，比如行键
4 >使用HTablePool，解决HTabl

最低0.47元/天解锁文章

do_what_you_can_do

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。