Spark编写wordcount程序

最新推荐文章于 2022-04-08 11:18:27 发布

sinat_41642318

最新推荐文章于 2022-04-08 11:18:27 发布

阅读量349

点赞数

分类专栏：大数据笔记

本文链接：https://blog.csdn.net/sinat_41642318/article/details/81836433

版权

大数据笔记专栏收录该内容

17 篇文章 1 订阅

订阅专栏

这里写图片描述

package demo

import org.apache.spark.{SparkConf, SparkContext}

//开发一个scala版本的wordcount
/*
bin/spark-submit --master spark://bigdata111:7077 --class demo.MyWordCount /root/temp/mywordcount.jar hdfs://192.168.157.111:9000/input/data.txt hdfs://192.168.157.111:9000/output/0608/wc2
 */
object MyWordCount {
  def main(args: Array[String]): Unit = {
    //配置
    val conf = new SparkConf().setAppName("MyWordCount")  //.setMaster("local")

    //核心创建一个SparkContext
    val sc = new SparkContext(conf)

    //使用sc对象执行任务
//    sc.textFile("hdfs://192.168.157.111:9000/input/data.txt")
//        .flatMap(_.split(" "))
//         .map((_,1))
//          .reduceByKey(_+_)
//            .saveAsTextFile("hdfs://192.168.157.111:9000/output/0608/wc1")
    sc.textFile(args(0))
      .flatMap(_.split(" "))
      .map((_,1))
      .reduceByKey(_+_)
      .saveAsTextFile(args(1))

    //停止SparkContext对象
    sc.stop()
  }
}

sinat_41642318

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark编写wordcount程序

package demoimport org.apache.spark.{SparkConf, SparkContext}//开发一个scala版本的wordcount/*bin/spark-submit --master spark://bigdata111:7077 --class demo.MyWordCount /root/temp/mywordcount.jar hdfs:/...
复制链接

扫一扫