Spark——二次排序(scala)

本文介绍了在Spark中如何使用Scala实现二次排序的两种方法:一是通过分组和手动排序,二是自定义数据类型并实现Ordered和Serializable接口。内容包括自定义数据类型的比较规则,以及两种方法的排序结果展示。
摘要由CSDN通过智能技术生成

Spark实现二次排序的两个版本(Scala):
(1)利用分组,手动将第二个元素按规则排序
(2)自定义数据类型,继承Ordered和Serializable接口,实现compare方法。
(此方法和Hadoop中MapReduce实现二次排序的方法类似)

case class MySecType(first: String,second: Int) extends Ordered[MySecType] with Serializable{
   
  override def compare(that: MySecType): Int = {
    if(this.first != that.first)
      this.firs
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值