spark重写排序规则（一）

最新推荐文章于 2023-02-15 23:51:06 发布

爱你魔力转圈圈

最新推荐文章于 2023-02-15 23:51:06 发布

阅读量191

点赞数

分类专栏： spark bigdata 文章标签： spark

本文链接：https://blog.csdn.net/qq_42706464/article/details/108354900

版权

bigdata 同时被 2 个专栏收录

70 篇文章 1 订阅

订阅专栏

spark

23 篇文章 1 订阅

订阅专栏

1.样例类实现自定义排序，需要实现ordered特质,不需要实现serializable，不需要new对象
2.普通类实现自定义排序，需要实现ordered特质,实现serializable（本文普通类）

姓名name 年龄age 颜值fv
文本为Array(“mimi1 22 86”, “mimi2 22 86”, “mimi3 23 87”)
按照颜值降序、年龄降序排列

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object CustomSort_1 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf()
    conf.setAppName(this.getClass.getName).setMaster("local[2]")
    val sc: SparkContext = new SparkContext(conf)
    val userInfo: RDD[String] = sc.parallelize(Array"mimi1 22 86", "mimi2 22 86", "mimi3 23 87"))
     //对文本进行拆分，并返回一个person1对象
    val personRDD: RDD[person1] = userInfo.map(x => {
      val arr = x.split(" ")
      val name = arr(0)
      val age = arr(1).toInt
      val fv = arr(2).toInt
      new person1(name, age, fv)
    })
    //指定排序规则x=>x既按照person1的compare进行排序
    val sorted: RDD[person1] = personRDD.sortBy(x => x)
    println(sorted.collect.toBuffer)
  }
}
//普通类实现自定义排序，需要实现ordered特质,实现serializable
// 样例类实现自定义排序，需要实现ordered特质,不需要实现serializable，不需要new对象
//case class person1.....   使用时 person1(name, age, fv)
class person1(val name:String,val age:Int, val fv:Int) extends Serializable with Ordered[person1]{
  override def compare(that: person1): Int = {
    if(this.fv!=that.fv)
     that.fv- this.fv
    else that.age - this.age
  }

  override def toString: String = s"$name,$age,$fv"
}

运行结果

ArrayBuffer(mimi3,23,87, mimi1,22,86, mimi2,22,86)

爱你魔力转圈圈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark重写排序规则（一）

1.样例类实现自定义排序，需要实现ordered特质,不需要实现serializable，不需要new对象（本文样例类）2.普通类实现自定义排序，需要实现ordered特质,实现serializable姓名name 年龄age 颜值fv文本为Array(“mimi1 22 86”, “mimi2 22 86”, “mimi3 23 87”)按照颜值降序、年龄降序排列import org.apache.spark.rdd.RDDimport org.apache.spark.{Spa
复制链接

扫一扫

专栏目录