大数据学习8：YARN的工作原理

最新推荐文章于 2022-10-02 15:56:19 发布

月魂_123123

最新推荐文章于 2022-10-02 15:56:19 发布

阅读量511

点赞数

分类专栏：大数据文章标签： hadoop yarn mapreduce

大数据专栏收录该内容

40 篇文章 4 订阅

订阅专栏

YARN工作原理：

YARN比MapReduce1更具一般性，实际上MapReduce只是YARN应用的一种形式。

相比经典的MapReduce来说，YARN的顶层包括更多的实体：

(1)client客户端。

(2)YARN资源管理器。负责协调集群上计算资源的分配。

(3)YARN节点管理器。负责启动和监视集群中机器上的计算容器。

(4)应用程序master。负责协调运行MapReduce作业的任务。

(5)分布式文件系统。

主要是多了一个容器[一个容器包含了一定的资源（memory 和CPU 和磁盘IO）]的概念。每一个任务都有一个对应的容器，而且只能在该容器中运行。

工作原理：

从图中可以看出YARN运行MapReduce的过程有13个步骤，我们分别来看看：

1、启动一个job。

2、从资源管理器请求一个新的作业ID。

3、检查作业的输出说明并计算作业的输入分片，然后将作业资源复制到HDFS。

4、通过调用资源管理器的submitApplication()方法提交作业。

5、将请求传递给调度器，产生容器。

a、初始化容器。

b、资源管理器在节点管理器的管理下在容器中启动master进程。

6、master进程对作业进行初始化。

7、获取计算出的输入分片，为每个分片创建一个map任务。并创建reduce任务。

8、master为作业向资源管理器请求容器(资源)来运行任务。

9、 a、返回调度器申请的资源列表，

b、master为任务分配容器。master与资源列表中NodeManager管理器通信，NnodeManager为任务设置运行环境，shell脚本启动容器。

10、资源本地化。

11、运行map/reduce任务。

12、Map Task 和 Reduce Task向 MR AM 汇报自己的状态和进度

13、MR ApplicationMaster 向Application Manger注销，并关闭自己。

这样一个YARN运行的MapReduce的原理也就完整了。

转:http://axuebin.com/blog/2016/02/23/hadoop-mapreduce-yarn/?utm_source=tuicool&utm_medium=referral

转:http://blog.itpub.net/30089851/viewspace-2118276/

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据学习8：YARN的工作原理

YARN工作原理： YARN比MapReduce1更具一般性，实际上MapReduce只是YARN应用的一种形式。相比经典的MapReduce来说，YARN的顶层包括更多的实体：(1)client客户端。(2)YARN资源管理器。负责协调集群上计算资源的分配。(3)YARN节点管理器。负责启动和监视集群中机器上的计算容器。(4)应用程序master。负责协调运行MapR
复制链接

扫一扫

专栏目录

月魂_123123 CSDN认证博客专家 CSDN认证企业博客

码龄12年

59: 原创

-: 周排名

73万+: 总排名

15万+: 访问

: 等级

2143: 积分

63: 粉丝

35: 获赞

7: 评论

135: 收藏

私信

关注

热门文章

分类专栏

大数据 40篇
oracle 11篇
java 10篇
操作系统和主机 4篇
MySQL 2篇
python 1篇

最新评论

大数据学习12：hadoop，hive 踩坑篇，持续更新！！
Dead Duck: 真牛啊！翻遍全网才找到！顶一个
大数据学习：MAVEN编译下载太慢，修改为阿里源做法
卢说: 有用，谢谢
java学习3：集合遍历增删报错，at java.util.HashMap$KeyIterator.next
酷酷的朱先森i: 大佬不错不错，解决了我的问题！
大数据学习15：报错 FAILED: SemanticException Unable to determine if
qq_45869443: 想问问，如果使用自定义函数，端口访问被拒，应该怎么去找问题呢，想让您帮我看看这个问题 hive (default)> SELECT LowerUDF(name) FROM person; FAILED: SemanticException Unable to determine if hdfs://iflytek001:9000/user/hive/warehouse/person is encrypted: java.net.ConnectException: Call From iflytek001/192.168.146.197 to iflytek001:9000 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused
大数据学习38：ElasticSearch 基础和常用命令-增删改查
wessiyear: 请问下博主，怎么处理版本冲突呢？比如我有两个http请求，都是通过_update_by_query?wait_for_completion=false执行的，并且都会修改同一个文档，但是修改文档的字段不一样。我这里执行这两个http请求，会导致其中一个没有执行，因为版本冲突。请问怎么可以同时执行呢？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。