order by 全局排序,只有一个reducer。 sort by 区内排序,每个reducer内部排序,需要指定分区原则,因此与distribute by 连用。 distribute by 分区排序。 cluster by 当 distribute by 的字段和 sort by 的字段相同时,可代替 distribute by 和 sort by 。