Hadoop的第二个框架Yarn,Yarn是一个资源管理器和任务调度器,
云计算的三层服务
普遍认为,云计算包括以下几个层次的服务:IaaS、PaaS和SaaS。这里所谓的层次,是分层体系架构意义上的“层次”。IaaS、PaaS、SaaS分别实现在基础设施层、软件开放运行平台层、应用软件层。
IaaS(Infrastructure-as-a-Service):基础设施即服务。消费者通过Internet可以从完善的计算机基础设施获得服务。Iaas通过网络向用户提供计算机(物理机和虚拟机)、存储空间、网络连接、负载均衡和防火墙等基本计算资源;用户在此基础上部署和运行各种软件,包括操作系统和应用程序等。
PaaS(Platform-as-a-Service):平台即服务。PaaS是将软件研发的平台作为一种服务,以SaaS的模式提交给用户。平台通常包括操作系统、编程语言的运行环境、数据库和 Web 服务器等,用户可以在平台上部署和运行自己的应用。通常而言,用户不能管理和控制底层的基础设施,只能控制自己部署的应用。
SaaS(Software-as-a-Service):软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。云提供商在云端安装和运行应用软件,云用户通过云客户端(比如Web 浏览器)使用软件。
从云计算分层概念上讲,YARN可看做PAAS层,它能够为不同类型的应用程序提供统一的管理和调度。
yarn其实就类似一个小型的操作系统,能实现任务调度,属于三层云计算中的Paas这一层。
具体运行的流程,如统计每个文件当中出现的次数
Hadoop2是引进了yarn的结构,此图再yarn的 Architecture 章节里面,里面有对其yarn进行详细的介绍:https://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/YARN.html