MapReduce之输入输出类型

最新推荐文章于 2022-10-03 13:43:01 发布

冰涛

最新推荐文章于 2022-10-03 13:43:01 发布

阅读量695

点赞数 1

分类专栏： java 文章标签： mapreduce map reduce combiner

java 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

转载：http://blog.csdn.net/lucktroy/article/details/7957120

话说用hadoop MapReduce编程有一阵子了，但是关于Mapper, Combiner, Reducer的输入输出类型居然花了我一整天。

我本以为Combiner的输入与Mapper的输出一致，Combiner的输出与Reducer的输入一致就可以了，就像图1：

图1 假想

我的程序Mapper输出是<Text, DoubleWritable>; Combiner的输入输出分别是<Text, DoubleWritable>, <Text, Text>; 然后Reducer的输入是<Text, Text>.

我本想逻辑上都没问题，但事与愿违，老出错.

在hadoop中，默认的job.setOutputkeyClass(*.class), job.setOutputValueClass(*.class)是针对Mapper与Reducer的，这里因为两者不同，我试着用job.setMapOutputKeyClass(*.class)与job.setMapOutputValueClass(*.class)区分. 但依然有错误.

在几经周折后，在看完一篇博文“《Data-intensive Text Processing with MapReduce》读书笔记第3章：MapReduce算法设计(1)”后，发现原来Mapper与Combiner的输出均要与Reducer对应（见图2），于是改了过来，终于通过，因为没有看过hadoop源码，所以也不知道它底层具体是如何实现的.

图2 实际

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。