Hadoop之MapReduce工作流程

最新推荐文章于 2024-05-13 05:55:18 发布

Lumos`

最新推荐文章于 2024-05-13 05:55:18 发布

阅读量2k

点赞数 2

分类专栏： Hadoop 文章标签： hadoop MapReduce 工作流程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41910694/article/details/91361127

版权

Hadoop 专栏收录该内容

27 篇文章 1 订阅

订阅专栏

Hadoop之MapReduce工作流程

目录

流程示意图
流程详解
注意

1. 流程示意图

MapReduce工作流程
流程示意图，如下图
在这里插入图片描述

2. 流程详解

上面的流程是整个mapreduce最全工作流程，但是shuffle过程只是从第7步开始到第16步结束，具体shuffle过程详解，如下：

maptask收集我们的map()方法输出的kv对，放到内存缓冲区中
从内存缓冲区不断溢出本地磁盘文件，可能会溢出多个文件
多个溢出文件会被合并成大的溢出文件
在溢出过程中，及合并的过程中，都要调用partitioner进行分区和针对key进行排序
reducetask根据自己的分区号，去各个maptask机器上取相应的结果分区数据
reducetask会取到同一个分区的来自不同maptask的结果文件，reducetask会将这些文件再进行合并（归并排序）
合并成大文件后，shuffle的过程也就结束了，后面进入reducetask的逻辑运算过程（从文件中取出一个一个的键值对group，调用用户自定义的reduce()方法）

3. 注意

Shuffle中的缓冲区大小会影响到mapreduce程序的执行效率，原则上说，缓冲区越大，磁盘io的次数越少，执行速度就越快。
缓冲区的大小可以通过参数调整，参数：io.sort.mb 默认100M。

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
Hadoop之MapReduce工作流程

Hadoop之MapReduce工作流程目录流程示意图流程详解注意1. 流程示意图MapReduce工作流程流程示意图，如下图2. 流程详解上面的流程是整个mapreduce最全工作流程，但是shuffle过程只是从第7步开始到第16步结束，具体shuffle过程详解，如下：maptask收集我们的map()方法输出的kv对，放到内存缓冲区中从内存缓冲区不断溢...
复制链接

扫一扫

专栏目录

Lumos` CSDN认证博客专家 CSDN认证企业博客

码龄6年

328: 原创

2万+: 周排名

2万+: 总排名

51万+: 访问

: 等级

6020: 积分

5523: 粉丝

431: 获赞

158: 评论

1817: 收藏

私信

关注

热门文章

分类专栏

WebRTC 22篇
流媒体服务器 19篇
网络编程 1篇
流媒体协议 18篇
FFmpeg 25篇
Hive 6篇
Go 26篇
设计模式 7篇
杂项整理 9篇
RTSP服务器 7篇
代码提升 3篇
ElasticSearch 3篇
Linux 2篇
LeetCode 20篇
C/C++ 11篇
工具 13篇
Java多线程 27篇
java基础解析 13篇
JVM 19篇
Hadoop 27篇
数据结构与算法 48篇
Spark 5篇
计算机网络 4篇
学习方法论 9篇
ZooKeeper 7篇
MySQL和Redis 5篇

最新评论

SRS流媒体服务器——SRS4.0 WebRTC⼀对⼀通话环境搭建与逻辑分析
碰碰real: 你好，一对一通话，双方alert是成功的；但是，对方的视频一直在转圈圈，能指导下吗？参照https://github.com/ossrs/srs/issues/2148该了配置文件的candidate，仍然是转圈圈
SRS流媒体服务器——服务器给RTMP拉流端转发数据
on1y0ne: 请问一下：我只找到SRS中接收Chunk组装成Message的源码，却没有找到将Message拆分成Chunk发送的源码，能告知吗？
Ubuntu下搭建Janus Server
m0_53792994: 如果用自己本机的虚拟机做 IP应该是啥呢
OWT Server整体架构分析 [Open WebRTC Toolkit]
、、、、南山小雨、、、、: 好的，感谢
OWT Server整体架构分析 [Open WebRTC Toolkit]
Lumos`: WebRTC Native 开发实战这本书

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。