spark 分组排序 demo

最新推荐文章于 2023-06-06 22:59:55 发布

小手追梦

最新推荐文章于 2023-06-06 22:59:55 发布

阅读量104

点赞数

分类专栏： hadoop实战

本文链接：https://blog.csdn.net/epitomizelu/article/details/118115399

版权

hadoop实战专栏收录该内容

137 篇文章 6 订阅

订阅专栏

package interview

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object GroupSort {
  def main(args: Array[String]): Unit = {
    val conf: SparkConf = new SparkConf()
      .setMaster("local[*]")
      .setAppName(this.getClass.getCanonicalName)
      .set("spark.default.parallelism","1")
      .set("spark.sql.shuffle.partitions","1")

    val sc = new SparkContext(conf)
    val dataRDD: RDD[String] = sc.textFile("data/input/groupsorts.txt")

    dataRDD.map(_.split(" "))
      .map(arr=>arr(0)->Integer.parseInt(arr(1)))
      .groupByKey()
      .flatMap(kv=>{
        kv._2.toList.sortWith(_ > _).map(kv._1->_)
      }).foreach(println)
  }
}

数据：

aa 21
bb 51
cc 54
aa 51
bb 53
cc 58
aa 61
bb 54
cc 57
aa 58
bb 61
cc 54
aa 57
bb 58
cc 55

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小手追梦

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
3
评论
spark 分组排序 demo

package interviewimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}object GroupSort { def main(args: Array[String]): Unit = { val conf: SparkConf = new SparkConf() .setMaster("local[*]") .setAppName(this
复制链接

扫一扫