大数据学习03 Spark入门项目 wordCount 不同的实现

最新推荐文章于 2022-07-05 16:33:42 发布

燕大扎克伯格

最新推荐文章于 2022-07-05 16:33:42 发布

阅读量700

点赞数 3

分类专栏：大数据 Spark 文章标签： spark big data scala

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yumiao168/article/details/122307199

版权

2# 大数据学习03 Spark入门项目 wordCount 不同的实现

文章目录

前言
一、聚合
二、代码实现
- 第二种方式实现wordCount代码
总结

前言

简述02的学习内容

1.建立与Spark框架的连接

    val sparConf = new SparkConf().setMaster("local").setAppName("WordCount")
    val sc = new SparkContext(sparConf)

2.按行读取文件目录

val lines:RDD[String] = sc.textFile("data")

3.扁平化操作，将一行数据拆分形成一个一个的单词

val words:RDD[String] = lines.flatMap(_.split(" "))

4.单词分组

val wordToCount = wordGroup.map {
      case (word, list) => {
        (word, list.size)
      }
    }

提示：以下是本篇文章正文内容，下面案例可供参考

一、聚合

第一种方法使用.size没有体现聚合的过程本方法则是聚合的过程

二、代码实现

第二种方式实现wordCount代码

代码如下（示例）：

package com.test.bigdata.spark.core.wc

import org.apache.spark.rdd.RDD
import org.apache.spark

最低0.47元/天解锁文章

燕大扎克伯格

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
大数据学习03 Spark入门项目 wordCount 不同的实现

大数据学习03 Spark入门项目 wordCount 不同的实现文章目录大数据学习03 Spark入门项目 wordCount 不同的实现前言一、聚合二、使用步骤1.引入库2.读入数据总结前言简述02的学习内容1.建立与Spark框架的连接 val sparConf = new SparkConf().setMaster("local").setAppName("WordCount") val sc = new SparkContext(sparConf)2.按行读取文件
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

燕大扎克伯格 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。