Hadoop Mapreduce分区、分组、二次排序过程详解
1、MapReduce中数据流动 (1)最简单的过程: map - reduce (2)定制了partitioner以将map的结果送往指定reducer的过程: map - partition - reduce (3)增加了在本地先进性一次reduce(优化)过程: map - combin(本地reduce) - partition -reduce2、Mapreduce中...
原创
2019-01-08 13:21:22 ·
489 阅读 ·
0 评论