MapReduce案例:Wordcout

1.需求分析
在给定的文本文件中统计输出每一个单词出现的总次数

1.1 往hello.txt输入以下数据

你好 beautiful nice hey ad
hahaha
test
test
0319
0326
0326
0326

1.2 期望输出数据值

0319	1
0326	3
ad	1
beautiful	1
hahaha	1
hey	1
nice	1
test	2
你好	1

2.开发步骤
按照MapReduce编程规范,分别编写Mapper,Reducer,Driver

(1) Mapper

1.1 将MapTask传给我们的文本内容先转换成String
1.2根据空格将这一行切分成单词
1.3将单词输出为<单词,1>
(2) Reducer
2.1汇总各个key的个数
2.2 输出该key的总次数
(3) Driver
3.1获取配置信息,获取job对象实例
3.2指定本程序的jar所在的路径
3.3关联Mapper/Reducer的业务类
3.4指定Mapper输出数据的kv类型
3.5指定最终输出的数据的kv类型
3.6 指定job的输入原始文本所在目录
3.7 指定job的输出结果所在目录
3.8 提交作业
3.项目搭建
(1)配置maven工程中pom.xml文件的依赖

<dependencies>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>RELEASE</version>
        </dependency>
        <dependency>
            <groupId>org.apache.logging.log4j</groupId>
            <artifactId>log4j-core</artifactId>
            <version>2.8.2</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.7.2</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.7.2</version>
        </dependency>
        <dependency>
            
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是小小白!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值