take top takeOrdered 的基本使用方法

take
top
takeOrdered 的使用

        val spark = SparkSession
            .builder
            .master("local[*]")
            .appName("TakeTakeOrderedTop")
            .getOrCreate()
        val sc = spark.sparkContext

        // take, 不对数据进行排序,返回rdd 中从0到N 的下标表示的值
        val rdd1 = sc.parallelize(Seq(11, 2, 30, 4, 9, 100,8,90,99,8), 4)
        rdd1.take(90).foreach(println)

        println("----------------------------")
        // top 默认降序排序, 调用了takeOrder,
        // def top(num: Int)(implicit ord: Ordering[T]): Array[T] = withScope {
        // takeOrdered(num)(ord.reverse)
        //}
        val rdd2 = sc.makeRDD(Seq(11, 2, 30, 4, 9, -100,8,90,99,8), 8)
        rdd2.top(100).foreach(println)
        // 改变其默认排序方式
        implicit  val myOr = implicitly[Ordering[Int]].reverse
        println("-------------------------")
        rdd2.top(100).foreach(println)

        // 特殊数据类型需要指定排序方式, 特殊数据,每一列的数据格式需要是相同的
        val rdd3 = sc.parallelize(Array((1, 2, 3.0), (3, 2, 4.0), (1, 33, -5.0)))
        rdd3.top(100)(Ordering.by[(Int, Int, Double), Double](_._3).reverse).foreach(println)
        rdd3.top(100)(Ordering.by[(Int, Int, Double), Double](_._3)).foreach(println)

        // takeOrder, 普通数据类型会自动向上转型, 类似top, 默认是升序的
        val rdd4 = sc.makeRDD(List(1, -22, 33, 44.0, 5, 99.0, 0.99))
        rdd4.takeOrdered(9).foreach(println)
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值