用scala实现spark版：单词统计案例

最新推荐文章于 2022-01-08 10:15:02 发布

CN_L

最新推荐文章于 2022-01-08 10:15:02 发布

阅读量1.3k

点赞数 1

分类专栏： spark 文章标签：大数据

本文链接：https://blog.csdn.net/lcn_Lynn/article/details/89501173

版权

首先吐槽一下csdn，目前不支持scala语言输入！！希望后续维护更新！

import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.rdd.RDD

/**
  * Date:2019/4/24
  * Author:Lynn.cn.Li
  * Desc:学习scala语言开发实现spark版：词计数
  */
object WordCount {
  def main(args: Array[String]): Unit = {
    //创建SparkConf对象，这只appName和master地址
    val conf: SparkConf = new SparkConf().setAppName("LocalWordCount").setMaster("local[2]")

    // 2.创建SparkContext对象
    val context: SparkContext = new SparkContext(conf)

    // 3.读取数据文件

    val dataRDD: RDD[String] = context.textFile("g://input/1.txt")

    //4.切分文件中的每一行,返回文件所有单词
    val wordRDD: RDD[String] = dataRDD.flatMap(_.split(" "))

    // 5.每个单词计数为1：(单词，1)
    val wordAndOne: RDD[(String, Int)] = wordRDD.map((_,1))

    // 6.相同单词出现的次数累加
    val reslutRDD: RDD[(String, Int)] = wordAndOne.reduceByKey(_+_

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CN_L

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
用scala实现spark版：单词统计案例

首先吐槽一下csdn，目前不支持scala语言输入！！希望后续维护更新！import org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.rdd.RDD/** * Date:2019/4/24 * Author:Lynn.cn.Li * Desc:学习scala语言开发实现spark版：词计数...
复制链接

扫一扫