spark Scala版本实验四2

最新推荐文章于 2024-04-25 22:12:23 发布

unique_xl

最新推荐文章于 2024-04-25 22:12:23 发布

阅读量201

点赞数

分类专栏：笔记文章标签： spark

本文链接：https://blog.csdn.net/unique_xl/article/details/109602109

版权

笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

spark Scala版本
实验四2

import org.apache.spark.{SparkConf, SparkContext}
object case2 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local").setAppName("reduce").set("spark.driver.host","localhost")
    val sc = new SparkContext(conf)
    sc.setLogLevel("ERROR")
    //获取数据
    val two = sc.textFile("file:///usr/local/spark/text_4/sec")
    two.filter(_.trim().length>0) //trim()函数返回空格个数
        .map(line=>(line.trim,""))//全部值当key，(key value,"")
          .groupByKey()//groupByKey,过滤重复的key value ，发送到总机器上汇总
              .sortByKey() //按key value的自然顺序排序
                  .keys.collect().foreach(println)//collect是将结果转换为数组的形式
  }
}

scala sdk版本：2.11.8
spark版本：2.1.0

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

unique_xl

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark Scala版本实验四2

spark Scala版本实验四2import org.apache.spark.{SparkConf, SparkContext}object case2 { def main(args: Array[String]): Unit = { val conf = new SparkConf().setMaster("local").setAppName("reduce").set("spark.driver.host","localhost") val sc = new Spark
复制链接

扫一扫