hive中的几种排序方式详解(附带具体数据)
数据:
1、order by 会对输入做全局排序,因此只有一个 reducer,会导致当输入规模较大时,需要较长的计算时间。
演示:
select
id,
score,
subject
from score1 order by score;
结果图:
2、sort by 不是全局排序,其在数据进入 reducer 前完成排序。因此,如果用 sort by 进行排序,并且设置 mapred.r...
原创
2020-05-01 18:46:01 ·
1804 阅读 ·
0 评论