hadoop过程

最新推荐文章于 2022-04-12 15:38:30 发布

Yan456jie

最新推荐文章于 2022-04-12 15:38:30 发布

阅读量524

点赞数

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yan456jie/article/details/51125726

版权

hadoop 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

map->shuffle->reduce

map->partition->sort->combine-> group->reduce

map->partition->buffer->sort->combine->spill->merge(combine)-------copy->merge(combine)->reduce

job.setInputFormatClass，默认TextInputFormat，将数据切分成<key,value>，传递给map

map。。。

combiner

第一次排序（不知道是不是这里）

setPartitionerClass，默认HashPartitioner，分割（按照某种规则分割，然后传递给reduce，在进行二次排序的时候需要重写），hash分割需要相同key在同一个部分

job.setSortComparatorClass 第二次排序，对分割好的各个部分排序

job.setGroupingComparatorClass reduce之前进行分组，将相同key放在一起，和partiton不同的是partition中不同key也可能在一组

job.setReducerClass reduce过程

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop过程

map->shuffle->reducemap->combine->partition->sort-> group->reducejob.setInputFormatClass，默认TextInputFormat，将数据切分成，传递给mapmap。。。combiner第一次排序（不知道是不是这里）setPartitionerClass，默认Has
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。