HIVE学习-参数调优案例

最新推荐文章于 2023-11-16 16:17:17 发布

递A剔A

最新推荐文章于 2023-11-16 16:17:17 发布

阅读量342

点赞数

分类专栏： HIVE学习文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011421398/article/details/107350547

版权

本文介绍了HIVE在处理仓库任务和报表数据时的参数调优，包括运行环境配置、计算引擎调整、HQL优化及手动优化策略。通过案例展示了如何合并小文件以提高效率，建议使用合适的连接键、过滤数据、原子化操作等技巧，以减少资源消耗。

摘要由CSDN通过智能技术生成

HIVE学习-参数调优案例

引子
最后的最后

引子

在日常工作中，会用到HIVE处理一些仓库任务和报表数据提数（条件所限，hive太慢，并不适应这种短平快的提数需求，一般都是用到impala或者spark，但是原先的大数据团队只提供了这个工具，暂且一用）。慢慢的会发现一些参数配置会发挥至关重要的作用，这也是这个组件应用到一定阶段一定会遇到的学习瓶颈，因此单开一个文章，慢慢地将学到的参数配置调优的知识点整理罗列，也是为了在这个平台上创造价值，促进互动和相互学习的氛围，激励自己的学习热情。

调优分类

调优必然是个循序渐进的过程，除非资深专业的数仓开发人员，才需要用到所有的参数配置优化，平日里大部分情况还是选用默认参数即可，因此此处我会一点点新增工作中汇用到的参数配置以及实际的案例说明，其他重要但一时半会用不上的就参考别人的文章了。

以下调优内容主要参考了如下的文章：

https://blog.csdn.net/SunWuKong_Hadoop/article/details/86160759

运行环境配置

--开始本地模式
set hive.exec.mode.local.auto=true;

待补充实际案例

计算引擎配置

H

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HIVE学习-参数调优案例

HIVE学习-参数调优案例引子案例一：通过hive或impala将小文件合并引子在日常工作中，会用到HIVE处理一些仓库任务和报表数据提数（条件所限，hive太慢，并不适应这种短平快的提数需求，一般都是用到impala或者spark，但是原先的大数据团队只提供了这个工具，暂且一用）。慢慢的会发现一些参数配置会发挥至关重要的作用，这也是这个组件应用到一定阶段一定会遇到的学习瓶颈，因此单开一个文章，慢慢地将学到的参数配置调优的知识点整理罗列，也是为了在这个平台上创造价值，促进互动和相互学习的氛围，激励自己
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。