HiveSQL优化技巧总结

笑看风云路

已于 2022-08-28 16:58:59 修改

阅读量1.1k

点赞数 7

分类专栏： hive 文章标签：数据库 hive 大数据

于 2022-08-24 22:28:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011109589/article/details/126513814

版权

hive 专栏收录该内容

34 篇文章 12 订阅 ¥19.90 ¥99.00

订阅专栏

本文总结了HiveSQL的优化技巧，包括列裁剪、分区裁剪、使用sort by代替order by、group by代替distinct、with as子查询优化、聚合操作的优化以及join、数据倾斜和严格模式等方面的优化策略，旨在提升大数据处理效率。

摘要由CSDN通过智能技术生成

大家好，我是风云，欢迎大家关注我的个人原创公众号【笑看风云路】获取更多大数据技术干货，在未来的日子里我们一起来学习大数据相关的技术，一起努力奋斗，遇见更好的自己！
扫码进，更快捷：

前言

基于Hive的开发过程中主要涉及到的可能是SQL优化这块。
优化的核心思想是：

减少数据量（例如分区、列剪裁）
避免数据倾斜（例如加参数、Key打散）
避免全表扫描（例如on添加加上分区等）
减少job数（例如相同的on条件的join放在一起作为一个任务）

一、SQL语句的结构

SELECT  *     （必须）
FROM    		表（数据源）
WHERE  			条件
GROUP

了解本专栏

笑看风云路

关注

7
点赞
踩
26

收藏

觉得还不错? 一键收藏
打赏
6
评论
HiveSQL优化技巧总结

基于Hive的开发过程中主要涉及到的可能是SQL优化这块。减少数据量（例如分区、列剪裁）避免数据倾斜（例如加参数、Key打散）避免全表扫描（例如on添加加上分区等）减少job数（例如相同的on条件的join放在一起作为一个任务）...
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

笑看风云路 你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。