yarn:资源协调器,是Hadoop的资源管理器
ResourceManager:整个集群资源(内存,cpu等)的老大
NodeManager:单个节点服务器资源老大
ApplicationMaster:单个任务运行的老大
Container:容器,相当于一台独立的服务器,里面封装了额任务运行所需要的资源,如内存,cpu,磁盘,网络等
MapReduce
1.App master(Container)
2.MapTask(Container)
3.ReduceTask(Container)
客户端(从海量资源中获取某文件)----->ResourceManager(每个DataNode分别开启mapTask并汇总ReduceTask)----->nameNode(Second NameNode)
备注1:客户端可以有多个
备注2:集群上可以运行多个ApplicatinMaster
备注3:每个NodeManager上可以有多个Container
备注: 每个DataNode都有一个ApplicationMaster,ApplicationMaster可以管理多个Container