RDD 返回新的分区数:
按指定分区数从新分配数据,数据会重新打乱(会进行shuffle操作)
2,
coalesce(numPartitions: Int, shuffle: Boolean =
false
)
按指定分区数从新分配数据,默认不进行shuffle操作(数据不会打乱),可设置。
3,在排序中 sortBy(_._2,false,1),最后一个参数可设置返回分区数