Spark实现二次排序的两个版本(Scala):
(1)利用分组,手动将第二个元素按规则排序
(2)自定义数据类型,继承Ordered和Serializable接口,实现compare方法。
(此方法和Hadoop中MapReduce实现二次排序的方法类似)
case class MySecType(first: String,second: Int) extends Ordered[MySecType] with Serializable{
override def compare(that: MySecType): Int = {
if(this.first != that.first)
this.firs