sparka 实现简单排序

最新推荐文章于 2020-11-29 13:39:57 发布

吃鱼的羊

最新推荐文章于 2020-11-29 13:39:57 发布

阅读量286

点赞数

分类专栏： SPARK

SPARK 专栏收录该内容

59 篇文章 6 订阅

订阅专栏

topN算法

基础topN

分组topN

--基础topN

--aaa.txt

4

2

5

9

7

1

6

4

7

把这些字符转换成map(x=>(x.toInt,x))，利用int类型的比较进行排序。

package com.lhj.www

import org.apache.spark.{SparkContext, SparkConf}

object Test {

def main(args: Array[String]) {

val conf = new SparkConf().setAppName("my app!!!").setMaster("local")

val sc = new SparkContext(conf)

val tmp = sc.textFile("aaa.txt").map(x=>(x.toInt,x)).sortByKey(false).map(x=>x._2)

tmp.collect().foreach(println)

}

}

--结果：

9

7

7

6

5

4

4

2

1

--分组topN

--aaa.txt

spark 99

hadoop 66

spark 91

hadoop 70

spark 98

hadoop 67

spark 97

hadoop 65

spark 98

hadoop 66

数字先转成int类型，然后做groupByKey，转换成 (hadoop,CompactBuffer(66, 70, 67, 65, 66))，在将后者转换成数组，用sortWith比较数组内部的元素

package com.lhj.www

import org.apache.spark.{SparkContext, SparkConf}

object Test {

def main(args: Array[String]) {

val conf = new SparkConf().setAppName("my app!!!").setMaster("local")

val sc = new SparkContext(conf)

val tmp = sc.textFile("aaa.txt").map(x=>(x.split(" ")(0),x.split(" ")(1).toInt)).groupByKey()

// (spark,CompactBuffer(99, 91, 98, 97, 98))

// (hadoop,CompactBuffer(66, 70, 67, 65, 66))

val tmp1=tmp.map(x=>(x._1,x._2.toList.sortWith(_>_).take(5))).sortByKey()

// (hadoop,List(70, 67, 66, 66, 65))

// (spark,List(99, 98, 98, 97, 91))

tmp1.collect().foreach(x=>{

println(x._1)

x._2.foreach(println)

})

}

}

--------------------------------

hadoop

70

67

66

66

65

spark

99

98

98

97

91

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sparka 实现简单排序

topN算法基础topN分组topN --基础topN --aaa.txt425971647 把这些字符转换成map(x=&gt;(x.toInt,x))，利用int类型的比较进行排序。 package com.lhj.www import org.apache.spark.{SparkContext, Sp...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。