mapreduce的执行流程以及shuffle过程

最新推荐文章于 2024-05-05 16:13:36 发布

快乐的小小编

最新推荐文章于 2024-05-05 16:13:36 发布

阅读量3.8k

点赞数 1

分类专栏： mapreduce 文章标签： mapreduce原理 shuffle过程原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaobianjava/article/details/39779711

版权

1、mapreduce概述

a.mapreduce是一种分布式的计算模型，由google提出，主要用于搜索领域，解决海量数据的计算问题。

b.mapreduce由两个阶段组成，map和reduce,用户只需要实现map()和reduce()两个函数，即可实现分布式计算。

c.这两个函数的key，value对，表示函数的输入信息。

2.mapreducer的作业执行流程：

图解：

3.MR过程中各个角色的作用：

1） JobTracker : 负责接收用户提交的作业，负责启动，跟踪任务， :初始化作业，分配作业协调监控整个作业

JobSubmissionProtocol是JobClient和JobTracker通信的接口

InterTrackerProtocol是TaskTracker与JobTracker通信的接口

2）JobClient::用户作业与JobTracker交互的主要接口，负责提交作业，负责启动，跟踪任务的执行，访问任务状态和日志

3）TaskTracker:定期与JobTracker通信，执行Map和Reduce任务

4）HDFS:保存作业的数据，配置，jar包，结果

4.MR执行流程细节：

1）作业提交：

a.提交作业之前，需要对作业进行配置：编写自己的MR程序；配置作业，包括输入输出路径等

b.提交作业，配置完成后，通过JobClient提交

c.具体功能：

JobClient与JobTracker通信得到一个jar包的存储路径和jobid；

输入输出路径检查是否存在

将job的jar包拷贝到HDFS

计算输入切片，将分片信息写到job.split中，切片的数量决定要启动几个mao任务

写job.xml

真正提交作业

2）作业初始化：

a.客户端提交作业后，JobTracker会将作业加入到作业调度器中，是一个队列的结构，然后进行作业的调度，默认是FIFO.

b.具体功能：

作业初始化主要是指JobInprocess中完成

最低0.47元/天解锁文章

快乐的小小编

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
mapreduce的执行流程以及shuffle过程

1、mapreduce概述 a.mapreduce是一种分布式的计算模型，由google提出，主要用于搜索领域，解决海量数据的计算问题。 b.mapreduce由两个阶段组成，map和reduce,用户只需要实现map()和reduce()两个函数，即可实现分布式计算。 c.这两个函数的key，value对，表示函数的输入信
复制链接

扫一扫

专栏目录

快乐的小小编 CSDN认证博客专家 CSDN认证企业博客

码龄11年

136: 原创

10万+: 周排名

114万+: 总排名

22万+: 访问

: 等级

3423: 积分

47: 粉丝

27: 获赞

18: 评论

81: 收藏

私信

关注

热门文章

分类专栏

最新评论

Nodejs 代码热更新实现
m0_38119705: 不是很懂，我刚接触这个，热更新如果是每次删除前都情况require的缓存，但是每次更新后又会重新往module.children添加，而之前添加的也不会因为require.cache的删除而删除，我直接清空module.children也是会增加内存，请问这个怎么解决？
手把手教你搭建一套可自动化构建的微服务框架
归云: 转的没图啊，原始链接有谁发一个吗
sso
BeiShangBuZaiLai: 认证中心演示地址http://47.105.151.82:2200/sso
charles抓包https设置
一只想飞的蜻蜓女猿: 为什么我还是不行，哭，还是现实unknown
overflow
qq_44199827: 求指点，只想隐藏左右溢出的，上下的不动，不要滚动条

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。