第7章 MapReduce 的工作机制 MapReduce 程序运行过程涉及的实体: 客户端,提交MapReduce 作业。YARN 资源管理器,负责协调集群上计算机资源的分配。YARN 节点管理器,负责启动和监视集群中机器上的计算容器(container)。MapReduce 的application master,负责协调运行 MapReduce 作业的任务。它和MapReduce 任务在容器中运行,这些容器由资源管理器分配并由节点管理器进行管理。分布式文件系统(一般为 HDFS ),用来与其他实体间共享作业文件。