yarn的详解

最新推荐文章于 2024-04-30 07:33:37 发布

~Erin

最新推荐文章于 2024-04-30 07:33:37 发布

阅读量812

点赞数

分类专栏： hadoop 文章标签： yarn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzlnd/article/details/103512763

版权

YARN是Hadoop 2中的资源管理系统，旨在改进MapReduce的执行。YARN通过分离作业调度和资源管理解决了Hadoop 1中的单点故障和资源利用率问题。在YARN中，资源管理器分配容器，应用程序Master（AM）负责任务调度和资源请求，节点管理器（NM）监控容器。核心组件包括AM、RM和NM，以及资源容器Container。

摘要由CSDN通过智能技术生成

yarn是什么？

yarn是hadoop集群的资源管理系统，是hadoop2中引入的。最初的目的是为了改善MapReduce的实现。

hadoop为什么引入yarn？

解释这个问题之前我们先来了解一下hadoop1中mapreduce的运行机制。

具体流程如下：
1).客户端通过submit()方法提交作业

2).submit()方法会创建一个内部的JobSummiter实例，并且调用submitJobInternal()方法提交作业，JobSummiter向JobTracker请求一个新的作业ID，该实例会检查本次作业是否可执行（比如：检查输出路径，计算作业的输入分片等），如果可执行会将运行所需要的作业资源（JAR、配置文件等）上传到文件系统（HDFS），

3).JobTracker接受到提交任务请求后，会放到一个内部队列里中，交由作业调度器（Job Scheduler）进行调度并初始化任务，从文件系统中获取客户端已经好的输入分片，（每个分片计算一个map），reduce任务数量由setNumReduceTask()方法设置

4).TaskTracker会定期向JobTracker发送“心跳”，表明TaskTracker是否存活，同时“心跳”是两者之间的消息通道，当TaskTracker空闲后，会通过“心跳”发送给JobTrac

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。