案例简述MapReduce与HDFS协同工作流程

最新推荐文章于 2023-02-07 18:53:43 发布

qq_29718979

最新推荐文章于 2023-02-07 18:53:43 发布

阅读量633

点赞数

分类专栏：云计算技术

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29718979/article/details/88385678

版权

MapReduce是Hadoop开源大数据包的重要计算工具，后期的Spark、Storm等组件均采用MapReduce的计算模型。而MapReduce在工作时，实际与HDFS在一起工作。接下来我用一个案例来解析MapReduce的工作流程。

1、Java程序采用MapReduce的SDK开发包进行程序开发。实际程序启动时，将在客户端创建一个JobClient端，正式开启一个MapReduce实例。

2、JobClient通过getNewJobId()接口向Master节点中的JobTracker请求创建一个新的MapReduce作业。

3、JobClient将程序执行JAR包、配置文件、数据块，下发到HDFS中属于JobTracker的目录下。

4、完成以上准备工作后，JobClient调到JobTrakcer的submitJob()接口提交作业。

5、JobTracker将提交的作业放入作业队列中等待作业调度。

6、JobTrakcer从HDFS中取出JobClient放好的数据，并创建对应数据的Map任务及Reduce任务。

7、接下来，JobTracker将空闲的TaskTracker分配具体的Map任务和Reduce任务。正常情况下，HDFS存储的服务器与Map任务服务器应在同一台服

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
案例简述MapReduce与HDFS协同工作流程

MapReduce是Hadoop开源大数据包的重要计算工具，后期的Spark、Storm等组件均采用MapReduce的计算模型。而MapReduce在工作时，实际与HDFS在一起工作。接下来我用一个案例来解析MapReduce的工作流程。1、Java程序采用MapReduce的SDK开发包进行程序开发。实际程序启动时，将在客户端创建一个JobClient端，...
复制链接

扫一扫

专栏目录

qq_29718979 CSDN认证博客专家 CSDN认证企业博客

码龄9年

169: 原创

23万+: 周排名

195万+: 总排名

25万+: 访问

: 等级

3636: 积分

85: 粉丝

62: 获赞

33: 评论

519: 收藏

私信

关注

热门文章

分类专栏

最新评论

学学做私有云的报价配置单
chenjingqi1991: 写的有点少，我就在做天翼云的私有云项目报价，计算服务器、管理服务器、分布式存储服务器、网元服务器，都得配上。然后计算服务器数量的公式，你这里边也没有。
数据库迁移常见的四种方法
weixin_44396392: 哈哈，我也觉得。我目前迁移遇到的问题是文章表内容里面有单引号，转成sql后运行有问题
数据库迁移常见的四种方法
Jason Gao: 说了等于没说
客户将数据库迁移上云的常用办法
彼方: 好文，学习了
客户将数据库迁移上云的常用办法
Cdf（人名）: 学到了，收藏一波~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。