最实用的hive优化参数配置，session级别配置灵活性高

最新推荐文章于 2022-03-11 11:40:45 发布

resin_404

最新推荐文章于 2022-03-11 11:40:45 发布

阅读量1.7k

点赞数 1

分类专栏： hive数据仓库文章标签：数据仓库 HIVE hive优化 hive参数配置 session

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/resin_404/article/details/97905635

版权

前言

在Hive优化方面，要做到性能最优，那就是得定制优化，针对不同的sql脚本设置不同的参数，配置不同的map和reduce数。保证局部性能最优，结果才会是效率最高。

那么在定制优化方面使用session级别的配置就是对症下药。所有的设置的参数只在一次Hive的cli命令起作用，关闭窗口或者退出命令行后整个配置参数全部失效，不会对其他脚本的运行环境造成影响。

配置清单：

1 创建session级别临时表，会话关闭临时表自动销毁
2 设置程序运行的队列环境
3 设置sql语句查询结果是否显示列名
4 开启动态分区的设置
5 动态设置分区达到默认数量上限
6 设置reduce数量
7 设置map数量
8 使用with cube 、grouping set的优化配置
9 是否自动转为mapjoin
10 在group by 阶段出现数据倾斜
11 hadoop作业JVM堆大小设置
12 控制是否启用查询执行的向量模式

详细讲解:

1 创建session级别临时表，会话关闭临时表自动销毁

CREATE TEMPORARY TABLE tmp 
(
 a       string    
,b       string        
,c       string
) ;

2 设置程序运行的队列环境

set mapred.job.queue.name=ne;
在这里插入图片描述

3 设置sql语句查询结果是否显示列名

set hive.cli.print.header=true;
select * from tmp2_jc_test limit 10;
在这里插入图片描述

4 开启动态分区的设置

set hi

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
最实用的hive优化参数配置，session级别配置灵活性高

前言在Hive优化方面，要做到性能最优，那就是得定制优化，针对不同的sql脚本设置不同的参数，配置不同的map和reduce数。保证局部性能最优，结果才会是效率最高。那么在定制优化方面使用session级别的配置就是对症下药。所有的设置的参数只在一次Hive的cli命令起作用，关闭窗口或者退出命令行后整个配置参数全部失效，不会对其他脚本的运行环境造成影响。配置清单：1 创建session...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。