学习Hadoop——YARN 框架特征

最新推荐文章于 2023-12-23 14:40:42 发布

2022冲鸭

最新推荐文章于 2023-12-23 14:40:42 发布

阅读量393

点赞数

分类专栏： hadoo

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/y805805/article/details/85871317

版权

hadoo 专栏收录该内容

26 篇文章 1 订阅

订阅专栏

Hadoop 1.0与2.0 的差异：都为集群环境 Hadoop2.0引入YARN 可以引用其他的应用

Apache Hadoop YARN 是一种新的Hadoop 资源管理器，它本身是一个通用资源管理系统，可为上层应用提供统一的资源

管理器和调度，它的引入为集群在利用率，资源统一管理和数据共享等方面带来巨大好处。

YARN 最初是为了修复Mapreduce 实现的明显不足而开发的，并对可伸缩性(支持一万个节点和二十万个内核的集群），

可靠性和集群利用率进行提升。YARN 实现这些需求的方式是，把JOB Traceker 的两个主要功能（资源管理和作业调度/监控)

分成两个独立的服务程序——全局的资源管理器（RM）和针对每个应用的Master（AM），这样一来，一个应用要么是传统

意义上的Mapreduce 任务，要么是任务有向无环图（DAG）

从某种意义上来说，它是一个云操作系统，它负责集群的资源管理，在YARN 之上可以开发各类的应用软件，例如批处理Mapreduce，内存管理Spark，流式处理Storm等，这些应用可以同时利用Hadoop 集群的计算能力和数据存储模型，共享同

一个Hadoop 集群和驻留在集群上的数据。此外新的框架还可利用YARN 的资源管理器，提供新的应用管理器实现。

yarn 框架及运行机制

从业界使用分布式系统的变化趋势和Hadoop 框架的长远发展来看，Mapreduce 的JobTracer/TaskTracer 机制需要大规模的

调整来修复它在可扩展性，内存消耗，线程模型，可靠性和性能上的缺陷。导致于对原框架做出改变的难度越来越大。

为从根本上解决旧的Mapreduce 框架的性能瓶颈，从0.23.0 版本开始，Hadoop的Mapreduce 框架完全重构，发生了根本

变化，新的Hadoop Mapreduce 框架命名为Mapreduce V2 或者叫YARN ，框架如下：

YARN的核心思想：将JobTracker 和TaskTacker 进行分离

1.一个全局的资源管理器ResourceManager

2.Resource Manager的每个节点代理Node Manager

3.代表每个应用的Aplication Master

4.每一个Aplication Master 拥有多个Container 并在Node Manager 上运行

YARN 调度框架：

双层调度架构：RM AM

基于资源预留的保留策略：

资源不够时，会Task 预留，直到资源充足，与“all or nothing” 策略不同

YARN 运行过程剖析：

1.ResourceManager 存在单点故障双击正在基于zookeeper 实现HA

2.NodeManager 失败后，RM 将失败任务告诉对应的AM，AM决定如何处理失败的任务

3.Application Master 失败后，有RM负责重启 AM 需要处理内部任务的容错问题

RM/Application 会保存完成的Task 重启无需重新运行

YARN 产生的技术需求：

直接源于MRV1在几方面的缺陷：（扩展性受限，单点故障，难以支持MR以外的计算）

多计算框架各自为战，数据共享困难：（MR：离线计算框架 Storm：实时计算框架 spark：内存计算框架）

MR 实时性要求不高，对整批量分析

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习Hadoop——YARN 框架特征

Hadoop 1.0与2.0 的差异：都为集群环境 Hadoop2.0引入YARN 可以引用其他的应用Apache Hadoop YARN 是一种新的Hadoop 资源管理器，它本身是一个通用资源管理系统，可为上层应用提供统一的资源管理器和调度，它的引入为集群在利用率，资源统一管理和数据共享等方面带来巨大好处。YARN 最初是为了修复Mapreduce 实现的明显不足而开发的，...
复制链接

扫一扫

专栏目录

2022冲鸭 CSDN认证博客专家 CSDN认证企业博客

码龄6年

128: 原创

5万+: 周排名

116万+: 总排名

20万+: 访问

: 等级

2289: 积分

80: 粉丝

65: 获赞

43: 评论

253: 收藏

私信

关注

热门文章

分类专栏

操作系统 6篇
redis 2篇
数据库 17篇
编程 9篇
大数 1篇
hadoo 26篇
操 6篇
数 1篇
结 1篇

最新评论

python面向对象——烤土豆，开枪案例
maketalot: 烤土豆代码问题严重，大致模板是对的，大小写不分，第三个def写到第二个def里去了等，第一处代码问题挺多的，直接复制肯定运行不了
linux 如何查看端口被哪个进程占用？
2022冲鸭: 那就说明没有装，自行安装下
linux 如何查看端口被哪个进程占用？
旭旭飞: 为什么我在linux写的代码都是未找到命令
linux中最常用的用户、组和权限
2022冲鸭: 嗯？
linux中最常用的用户、组和权限
睿思达DBA_WGX: 这个简单

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。