MapReduce计算任务的步骤

最新推荐文章于 2022-09-27 13:47:24 发布

Tian哈哈

最新推荐文章于 2022-09-27 13:47:24 发布

阅读量277

点赞数 6

文章标签： MapReduce

本文链接：https://blog.csdn.net/weixin_45746679/article/details/103106625

版权

inputformat 到HDFS上读取数据
将数据传给split

split将数据进行逻辑切分，
将数据传给RR

RR：将传入的数据转换成一行一行的数据，输出行首字母偏移量和偏移量对应的数据
将数据传给MAP

MAP：根据业务需求实现自定义代码
将数据传给shuffle的partition

partition：按照一定的分区规则，将key，value的list进行分区
将数据传给shuffle的sort

sort：对分区内的数据进行排序
将数据传给shuffle的combiner

combiner：对数据进行局部聚合
将数据传给shuffle的Group

Group：将相同key的key提取出来作为唯一的key
将相同key对应的value获取出来作为value的list
将数据传给Reduce

Reduce：根据业务需求进行最终的合并汇总，
将数据传给outputFormat

outputFormat：将数据写入HDFS

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注