一:reduce任务主动从磁盘中的mapper任务复制其输出键值对。mapper任务可能会有很多,因此reducer会复制多个mapper的输出。
二:把复制到reducer本地数据全部进行合并,把分散的数据合并成一个大的数据。在对合并后的数据排序。
三:堆排序后的键值对调用reduce方法。键相同的键值对调用一次reduce方法,每次调用会产生零个或多个键值对。最后把这些输出的简直对写入到hdfs文件中
mapreduce reduce阶段
最新推荐文章于 2023-07-08 21:50:09 发布