scala二次排序实现

最新推荐文章于 2020-09-02 19:09:51 发布

jin6872115

最新推荐文章于 2020-09-02 19:09:51 发布

阅读量1.1k

点赞数

分类专栏： Scala 文章标签： scala 二次排序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jin6872115/article/details/80175060

版权

Scala 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

二次排序就是按照不同字段进行排序

package test1

import org.apache.spark.{SparkConf, SparkContext}


class secondSort(val first:Int,val second:Int) extends Ordered[secondSort] with Serializable {
  override def compare(that: secondSort): Int = {
    if (this.first != that.first){
      this.first - that.first
    }else{
      this.second - that.second
    }

  }
}
object test{
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("second").setMaster("local")
    val sc = new SparkContext(conf)
     val arr = Array((2,1),(2,4),(2,3),(5,2),(5,4),(5,2),(4,3),(4,2),(4,1))
    sc.makeRDD(arr)
      .map(a=>(new secondSort(a._1,a._2),a))
      .sortByKey()
      .foreach(a=>
      println(a._2+"\t"))
      //    sc.textFile("D:\\a\\a.txt")
//      .map(a=>(new secondSort(a.split(",")(0).toInt,a.split(",")(1).toInt),a))
//      .sortByKey()
//      .foreach(a=>
//      println(a._2+"\t")
//      )
  }
}

类似于MapReduce里面的分组+排序的实现

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
scala二次排序实现

二次排序就是按照不同字段进行排序package test1import org.apache.spark.{SparkConf, SparkContext}class secondSort(val first:Int,val second:Int) extends Ordered[secondSort] with Serializable { override def compare...
复制链接

扫一扫

专栏目录

jin6872115 CSDN认证博客专家 CSDN认证企业博客

码龄14年

99: 原创

6万+: 周排名

82万+: 总排名

21万+: 访问

: 等级

2998: 积分

107: 粉丝

59: 获赞

31: 评论

562: 收藏

私信

关注

分类专栏

其他
hadoop 2篇
structure streaming 3篇
spring boot 1篇
javaSE 15篇
javaEE
连接 1篇
MapReduce 17篇
zookeeper 1篇
python 6篇
Hbase 16篇
hive 24篇
linux 2篇
Spark 23篇
Scala 8篇
kafka 1篇
redis 1篇
数据仓库 3篇
oracle 1篇
kylin 4篇
zepplin 2篇
superset 3篇
flink 2篇

最新评论

hive数据倾斜优化
xiansxn_356: mapreduce
MapReduce案例11——影评分析3（特定电影不同年龄段平均评分）
一只快乐的柠檬精823: 想问一下这些就是源代码了嘛谢谢
hive分区表新增字段（指定添加列的位置）+重刷历史方法(避免旧分区新增字段为NULL)
egWRDADA: 怎么调字段顺序的时候才不会数据错列
Hbase进行分页显示
zuzhilong2010: 这个分页是不是递归一页一页翻得，怎么感觉加了过滤条件后，查询更慢了，我的数据是存储在hbase中的一张大表里面
spark将数据写入hbase以及从hbase读取数据
菜鸟小徐哥: Exception in thread "main" org.apache.hadoop.mapred.InvalidJobConfException: Output directory not set. 启动主线程后报这样的错是什么情况

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。