- sort by 会在每个reduce中排序,全局无序,但是分区内有序
- order by 对输入做全局排序,只有一个reduce,当输入规模较大时,消耗时间很大
- distribute by 根据字段进行分区,类似MR中Partition,进行分区,结合sort by 使用
- cluster by等价于distribute by sort by,排序只能是升序排序,无法指定排序规则
Hive中sort by ,order by ,cluster by ,distribute by各代表什么意思
最新推荐文章于 2024-07-29 09:03:07 发布