order by 对数据进行全局排序,只有一个reducer。多个reducer不能保证全局有序 sort by 数据分区内有序 distribute by 数据按照key分配到不同的reduce中 cluster by 相当于 distribute by 结合 sort by,即按照key分配reduce又排序了。 每篇一言: 君子先行其言,而后从之。