Spark实现二次排序的第二种方式

最新推荐文章于 2022-07-02 10:43:55 发布

凯风与海

最新推荐文章于 2022-07-02 10:43:55 发布

阅读量630

点赞数

分类专栏： Spark

本文链接：https://blog.csdn.net/weixin_38963816/article/details/80287375

版权

Spark 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

###############################################

数据如下：

年份：气温

2005 19
2005 40
2006 30
2008 50

2007 35

2007 32

实现效果：

(2005,40)

(2006,30)
(2007,35)
(2008,50)

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {

  def main(args: Array[String]): Unit = {
    val conf = new SparkConf();
    conf.setMaster("local")
    conf.setAppName("wangjk")
    conf.set("spark.testing.memory", "2147480000")
    val sc = new SparkContext(conf);
    val r1=sc.textFile("file:///D:/docment/spark3.txt")
      val r3=r1.map(e=>(e.split(" ")(0),e.split(" ")(1)))   //e 为当前文本的一行，按照空格切开，成为元组(2005,19)
         .groupBy(e=>e._1)                                  //按照key聚合 (2005,CompactBuffer((2005,19), (2005,40)))
         .map(e=>(e._2.toList.sorted.reverse(0))).sortByKey()  //将第二个元素转成list 排序 倒排序 取第一个元素

      r3.foreach(println)

  }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

凯风与海

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark实现二次排序的第二种方式

###############################################数据如下：年份：气温2005 192005 402006 302008 502007 352007 32实现效果：(2005,40)(2006,30)(2007,35)(2008,50)import org.apache.spark.{SparkConf, SparkContext}object Wo...
复制链接

扫一扫