Hadoop系统入门之资源调度框架YARN

资源调度框架YARN
YARN产生背景
YARN执行流程
YARN概述
YARN架构
提交作业到YARN上执行

YARN产生背景:
MapReduce1.x==>MapReduce2.x
Master/slave : JobTracker/TaskTracker
JobTracker: 单点,压力大
仅仅只能够支持mapreduce作业

资源利用率
	所有的计划框架运行一个集群中,共享一个集群的资源,按需分配!

YARN概述
Yet Another Resource Negotiator
通用的资源管理系统
为上层应用提供统一的资源管理和调度

YARN架构
Client,ResourceManager,NodeManager,ApplicationMaster master/slave:RM/NM

Client: 向RM提交任务,杀死任务等。
ApplicationMaster:
每个应用程序对应一个AM。
AM向RM申请资源用于在NM上启动对应的Task数据切分。
为每个task向RM申请资源(container)。
NodeManager通信。
任务的监控。

NodeManager: 多个
干活
向RM发送心跳信息,任务的执行情况。
接收来自RM的请求来启动任务。
处理来自AM的命令。

ResourceManager:集群中同一时刻对外提供服务的只有1个,负责资源相关处理来自客户端的请求:提交,杀死。启动/监控AM.
监控NM,资源相关。

Container: 任务的运行抽象
Memory,cpu….
task是运行在container里面的。
可以运行am,也可以运行map/reduce task。

提交自己开发的MR作业到YARN上运行的步骤:
1)mvn clean package -DskipTests
Windows/Mac/Linux ==>Maven
2)把编译出来的jar包(项目根目录/target/…jar)以及测试数据上传服务器
scp xxxx hadoop@hostname:directory
3)把数据上传到HDFS
hadoop fs -put xxx hdfspath
4)执行作业
hadoop fs xxx.jar 完整的类名(包名+类名) args……
5)到YARN UI(8088) 上去观察作业的运行情况。
6)到输出目录去查看对应的输出结果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值