数仓工具—Hive语法之常见排序方式(7)

本文详细介绍了Hive中的四种排序操作:order by(全局排序)、sort by(分区内排序)、distribute by(数据分发)和cluster by。order by确保全局有序但可能导致性能问题,sort by仅保证每个分区内的排序,distribute by控制数据分发,常与sort by配合使用,而cluster by结合了distribute by和sort by的功能。文章通过实例展示了各种排序的使用和效果,并探讨了执行效率和limit子句的应用。
摘要由CSDN通过智能技术生成

hive 中的四种排序

排序操作是一个比较常见的操作,尤其是在数据分析的时候,我们往往需要对数据进行排序,hive 中和排序相关的有四个关键字,今天我们就看一下,它们都是什么作用。

Hive排序

数据准备

下面我们有一份温度数据,tab 分割

2008	32.0
2008	21.0
2008	31.5
2008	17.0
2013	34.0
2015	32.0
2015	33.0
2015	15.9
2015	31.0
2015	19.9
2015	27.0
2016	23.0
2016	39.9
2016	32.0

建表加载数据

create table ods_temperature(
    `year
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不二人生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值