Hadoop系统入门之资源调度框架YARN

最新推荐文章于 2023-06-19 08:21:55 发布

GoodMorning_可口可乐

最新推荐文章于 2023-06-19 08:21:55 发布

阅读量113

点赞数

分类专栏： hadoop 文章标签： java

本文链接：https://blog.csdn.net/GoodMorning_1992/article/details/119384021

版权

hadoop 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

资源调度框架YARN
YARN产生背景
YARN执行流程
YARN概述
YARN架构
提交作业到YARN上执行

YARN产生背景:
MapReduce1.x==>MapReduce2.x
Master/slave : JobTracker/TaskTracker
JobTracker: 单点，压力大
仅仅只能够支持mapreduce作业

资源利用率
	所有的计划框架运行一个集群中，共享一个集群的资源，按需分配！

YARN概述
Yet Another Resource Negotiator
通用的资源管理系统
为上层应用提供统一的资源管理和调度

YARN架构
Client,ResourceManager,NodeManager,ApplicationMaster master/slave:RM/NM

Client: 向RM提交任务，杀死任务等。
ApplicationMaster:
每个应用程序对应一个AM。
AM向RM申请资源用于在NM上启动对应的Task数据切分。
为每个task向RM申请资源(container)。
NodeManager通信。
任务的监控。

NodeManager: 多个
干活
向RM发送心跳信息，任务的执行情况。
接收来自RM的请求来启动任务。
处理来自AM的命令。

ResourceManager:集群中同一时刻对外提供服务的只有1个，负责资源相关处理来自客户端的请求:提交，杀死。启动/监控AM.
监控NM,资源相关。

Container: 任务的运行抽象
Memory,cpu….
task是运行在container里面的。
可以运行am,也可以运行map/reduce task。

提交自己开发的MR作业到YARN上运行的步骤:
1)mvn clean package -DskipTests
Windows/Mac/Linux ==>Maven
2)把编译出来的jar包(项目根目录/target/…jar)以及测试数据上传服务器
scp xxxx hadoop@hostname:directory
3)把数据上传到HDFS
hadoop fs -put xxx hdfspath
4)执行作业
hadoop fs xxx.jar 完整的类名(包名+类名) args……
5)到YARN UI(8088) 上去观察作业的运行情况。
6)到输出目录去查看对应的输出结果。

GoodMorning_可口可乐

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop系统入门之资源调度框架YARN

资源调度框架YARNYARN产生背景YARN执行流程YARN概述YARN架构提交作业到YARN上执行YARN产生背景:MapReduce1.x==>MapReduce2.xMaster/slave : JobTracker/TaskTrackerJobTracker: 单点，压力大仅仅只能够支持mapreduce作业资源利用率所有的计划框架运行一个集群中，共享一个集群的资源，按需分配！YARN概述Yet Another Resource Negotiator通用的资源
复制链接

扫一扫