1、order by 全局排序,相当于一个reduce,
2、sort by 按每一个reduce内部排序,不是全局排序
3、distribute by 类似于MRPartition,进行分区,一般要结合sort by使用
4、cluster by 当distribute和sort字段相同时,就是cluster by
1、order by 全局排序,相当于一个reduce,
2、sort by 按每一个reduce内部排序,不是全局排序
3、distribute by 类似于MRPartition,进行分区,一般要结合sort by使用
4、cluster by 当distribute和sort字段相同时,就是cluster by