Yarn 是一个资源管理,作业调度的框架。
Yarn产生背景:
Hadoop1.x时,MapReduce是Master/Slave架构。一个JobTracker带多个TaskTracker.
JobTracker负责资源管理和作业调度。TaskTracker,定期向JobTracker汇报本节点的健康状况,资源使用情况,作业执行情况,接受JobTracker的命令。
JobTracker一旦挂掉,Map Reduce则无法正常运行。
yarn 架构:
- ResourceManager:整个集群中同一时间提供服务只有一个。负责集群资源的统一调度和管理。处理客户端的请求:提交一个作业、杀死一个作业。监控NodeManager,一旦该nodeManager挂了,那么nodeManager运行的任务需要告诉ApplicationMaster。
- NodeMana