针对基本数据类型
方法一: rdd.top(N) 方法实现
方法二: DF/DS.sort() 方法 将rdd转换成DF、DS,使用其内置的函数sort().limit() 排序取topN
方法三: 先分区内排序mapPartition,后全局排序
针对键值对类型:
1.先使用grouobykey按键分组,将value转换成数组tolist,再用Scala的sortby或sortwith(自定义排序规则)去排序
2.
对键排序:sortBykey
3.自定义分区器,将不同的key分到不同分区,再用spark算子排序