Hadoop Mapreduce分区、分组、二次排序过程详解
1、MapReduce中数据流动
(1)最简单的过程: map - reduce
(2)定制了partitioner以将map的结果送往指定reducer的过程: map - partition - reduce
(3)增加了在本地先进性一次reduce(优化)过程: map - combin(本地reduce) - partition -reduce
2、Mapreduce中...
原创
2019-01-08 13:21:22 ·
529 阅读 ·
0 评论