spark排序案例:定义三个文件对文件内容进行排序(数字)

1.排序:
       定义三个文件对文件内容进行排序(数字)

数据:

1.txt

78
89
96
67

2.txt

80
82
84
86

3.txt

88
99
66
77 

spark代码:

 

import org.apache.spark.{HashPartitioner, SparkConf, SparkContext}

object paixu {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("MySort").setMaster("local")
    val sc = new SparkContext(conf)
    val dataFile = "D://wc//paixu//*.txt"
    val data = sc.textFile(dataFile,3)
    var index = 0
    val result = data.filter(_.trim().length>0).map(n=>(n.trim.toInt,""))
      .partitionBy(new HashPartitioner(1))
      .sortByKey()
      .map(t=>{index += 1;(index,t._1)})
    result.saveAsTextFile("D://wc//result")
  }

}

 运行结果:

(1,66)
(2,67)
(3,77)
(4,78)
(5,80)
(6,82)
(7,84)
(8,86)
(9,88)
(10,89)
(11,96)
(12,99)
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值