Hadoop之Wordcount流量统计入门实例

最新推荐文章于 2020-12-07 00:00:09 发布

脚踏实地，仰望星空

最新推荐文章于 2020-12-07 00:00:09 发布

阅读量293

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37469055/article/details/84592213

版权

一：何为MapReduce

HDFS和MapReduce是Hadoop的两个重要核心，其中MR是Hadoop的分布式计算模型。MapReduce主要分为两步Map步和Reduce步，引用网上流传很广的一个故事来解释，现在你要统计一个图书馆里面有多少本书，为了完成这个任务，你可以指派小明去统计书架1，指派小红去统计书架2，这个指派的过程就是Map步，最后，每个人统计完属于自己负责的书架后，再对每个人的结果进行累加统计，这个过程就是Reduce步。

二：WordCount程序

程序的功能：统计每个手机号的上行流量，下行流量和总流量。

流量数据如下：

Map实现代码如下:

Reduce实现代码如下:

流量统计实体类：

main方法运行类:

来看一下Job设置了哪些东西：

设置处理该作业的类，setJarByClass()
设置这个作业的名字，setJobName()
设置这个作业输入数据所在的路径
设置这个作业输出结果保存的路径
设置实现了Map步的类，setMapperClass()
设置实现了Reduce步的类，setReducerClass()
设置输出结果key的类型，setOutputKeyClass()
设置输出结果value的类型，setOuputValueClass()
执行作业

运行的结果如下:

脚踏实地，仰望星空

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。