top
val rdd = sc.parallelize(Array(23,67,12,90,8,67))
rdd.first
rdd.take(5)
//top全局排序,耗内存
rdd.top(1)
res24: Array[Int] = Array(90)
rdd.top(2)
res25: Array[Int] = Array(90, 67)
sortByKey
scala&
top
val rdd = sc.parallelize(Array(23,67,12,90,8,67))
rdd.first
rdd.take(5)
//top全局排序,耗内存
rdd.top(1)
res24: Array[Int] = Array(90)
rdd.top(2)
res25: Array[Int] = Array(90, 67)
sortByKey
scala&