大数据hive篇--hive优化

在路上的小y

于 2022-10-07 16:39:08 发布

阅读量1.3k

点赞数

分类专栏：大数据文章标签： hive 大数据 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43709558/article/details/127195935

版权

Hive 优化

核心思想：把Hive SQL 当做Mapreduce程序去优化
以下SQL不会转为Mapreduce来执行

select仅查询本表字段
where仅对本表字段做条件过滤
select 和 where 是不会转为mr来执行
Explain 显示执行计划
EXPLAIN [EXTENDED] query

Hive运行方式：
本地模式将数据抓取到本地计算
集群模式计算向数据移动主要耗费时间是提交任务和 yarn 资源管理

本地模式
开启本地模式：
set hive.exec.mode.local.auto=true; 测试可以用

注意：
hive.exec.mode.local.auto.inputbytes.max默认值为128M
表示加载文件的最大值，若大于该配置仍会以集群方式来运行！

并行计算 hive默认是没有开启的
通过设置以下参数开启并行模式：
set hive.exec.parallel=true;
注意：hive.exec.parallel.thread.number
（一次SQL计算中允许并行执行的job个数的最大值）

注意： sql 任务之间是不能互相有影响的才能使用并行计算计算机压力也会压力大一点
严格模式一般会打开
通过设置以下参数开启严格模式：
—防止用户误操作
set hive.mapred.mode=strict;
（默认为：nonstrict非严格模式）
查询限制：
1、对于分区表，必须添加where对于分区字段的条件过滤；优化查询
2、order

最低0.47元/天解锁文章

在路上的小y

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
大数据hive篇--hive优化

hive优化
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。