Yarn
Hadoop2.x版本出现
角色
ResourceManager
管理集群资源NodeManager
管理各个结点自身资源AppMaster
一次任务调度的领导Container
容器,分配资源用于一个Task的执行
资源管理
RM(ResourceManager
),了解集群中所有结点的资源信息。
NM(NodeManager
)掌握本台机器的资源信息,并需要定期向RM汇报自己的资源信息。
MapReduce on Yarn
MR-Cli
将任务所需文件(Jar(代码)、XML(参数)、切片信息(输入数据))上传到HDFSMR-Cli
到RM上申请执行这个任务所需的- RM找一台较为空闲的NM启动一个
Container
,并放射一个AppMaster
,用于调度本次任务 AppMaster
从HDFS下载切片信息,再到RM上申请资源- RM再通过
AppM