Yarn1 入门概述

最新推荐文章于 2022-10-31 20:59:39 发布

Auraros

最新推荐文章于 2022-10-31 20:59:39 发布

阅读量280

点赞数

分类专栏： # Yarn 文章标签： hadoop 大数据

本文链接：https://blog.csdn.net/qq_43634001/article/details/109054528

版权

6 篇文章 0 订阅

订阅专栏

Yarn 入门概述

更多整理都在我的github上：Auraros欢迎大家。

yarn产生之前，hadoop主要使用MRv1，在这里我们了解一下MRv1的一些局限性：

扩展性差：在MRv1中，JobTracker同时具备了资源管理和作业控制两个功能，在成为了系统的最大一个瓶颈，严重限制了Hadoop的集群扩展性。
可靠性差：MRv1采用了master/slave结构，容易出现单节点故障问题，即master节点出现了故障将会导致整个集群瘫痪不能使用
资源利用低：MRv1采用了基于槽位的资源分配模型，槽位是一种粗粒度的资源划分单位，通常一个一个任务不会用完槽位的所有资源，且其他任务不能够使用这些空闲资源。此外Hadoop奖槽位划分为Map Slot和Reduce Slot两种，且不允许资源共享，通常会导致一个槽位资源紧张另外一个闲置。（比如当启动时候）
**无法支持多种计算框架：**MRv1不能满足内存计算框架，流式计算框架、迭代计算框架等并存。

为了克服MRv1以上的几个缺点，MRv2的核心从mapreduce转到了资源管理系统Yarn，YARN 实际上是一个弹性计算平台，它的目标已经不再局限于支持 MapReduce 一种计算框架，而是朝着对多种框架进行统一管理的方向发展。相比于“一个集群一个计算框架”，共享集群的好处是：

下图为Yarn轻量级弹性计算平台：

关注