order by
全局排序
sort by
区内排序 通常与distribute by 连用(distribute by 是用来指定分区字段的),注意手动设置reducetask的个数
cluster by
如果sort by 和 distribute by 后面跟的是同一个字段,可以用cluster by代替,但是cluster by只能默认升序,如果指定desc(降序)会报错.
全局排序
区内排序 通常与distribute by 连用(distribute by 是用来指定分区字段的),注意手动设置reducetask的个数
如果sort by 和 distribute by 后面跟的是同一个字段,可以用cluster by代替,但是cluster by只能默认升序,如果指定desc(降序)会报错.