一:部署
1,nodeManager在物理机上应该跟datanode在一起
map端将来会到HDFS上读取数据
reduce端将来会写数据到HDFS上
2,resource Manager 应该独立部署在一台物理机上。
二:说明
1,yarn是一个分布式程序的运行调度平台。
2,yarn集群就安装在HDFS集群的机器上
3,角色分配
resource manager 1,接收用户提交的分布式计算程序,并为其划分资源
2,管理监控各个node manager上的资源情况,以便于均衡负载。
node manager 1,管理其所在机器上的运算资源。(cpu ,内存)
2,负责接收resource manager 分配的任务,创建容器,回收资源。
4,划分资源时,为了更好的描述,yarn中抽象了一个概念,容器:container
将MR程序提交到yarn集群上运行,Yarn会启动master,master然后启动worker。