WordCount（1）

最新推荐文章于 2021-09-01 15:30:47 发布

m0_48714980

最新推荐文章于 2021-09-01 15:30:47 发布

阅读量96

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_48714980/article/details/108520378

版权

1.读取文件需要用到抽象类InputFormat的子类TextInputFormat，把文件每行变成键值对如图，此时k1是距离文本开头的偏移量，v1为每行的内容，该键值对因TextInputFormat而产生，不需要手动书写
在这里插入图片描述
2.进入Map ，自定义Map逻辑，将k1 v1转为k2 v2
继承Mapper，重写map方法

3.进入shuffle阶段，此时拿到的数据是上述k2 v2
分区排序规约分组

4.通过shuffle流程以后，我们会得到新的k2 v2

5.进入Reduce阶段，自定义Reduce逻辑，将新的k2 v2 转换为k3 v3
继承Reducer，重写reduce方法

在这里插入图片描述
6.通过抽象类OutputFormat的子类TextOutputFormat将k3 v3 写到一个普通的文本文件中，最终得到结果

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
WordCount（1）

1.读取文件需要用到抽象类InputFormat的子类TextInputFormat，把文件每行变成键值对如图，此时k1是距离文本开头的偏移量，v1为每行的内容，该键值对因TextInputFormat而产生，不需要手动书写2.进入Map ，自定义Map逻辑，将k1 v1转为k2 v2继承Mapper，重写map方法3.进入shuffle阶段，此时拿到的数据是上述k2 v2分区排序规约分组4.通过shuffle流程以后，我们会得到新的k2 v25.进入Reduce阶段，自
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。