大数据存储与处理——YARN

最新推荐文章于 2024-04-14 11:57:14 发布

取个程序猿的名字

最新推荐文章于 2024-04-14 11:57:14 发布

阅读量378

点赞数

分类专栏：大数据存储与处理文章标签：大数据存储与处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45680007/article/details/102974785

版权

YARN（Yet Another Resource Negotiator）是为了改进Hadoop MapReduce v1的局限性而诞生的，它提供了统一的资源管理框架，支持多种计算框架如MapReduce、Tez、Storm和Spark。YARN的结构包括ResourceManager、NodeManager和ApplicationMaster，其中ResourceManager全局调度资源，NodeManager管理节点资源，ApplicationMaster负责应用的调度和监控。YARN还具备容错机制，如ResourceManager的高可用性和ApplicationMaster的自动重启。此外，YARN采用双层调度框架和资源预留策略来优化集群资源利用率。

摘要由CSDN通过智能技术生成

Yarn产生的原因

在这里插入图片描述
直接源于MRv1在几个方面的缺陷
扩展性受限
单点故障：JobTracker 完成了太多的任务，造成了过多的资源消耗
难以支持MR之外的计算

多计算框架各自为战，数据共享困难

在这里插入图片描述

YARN

即在一个集群上部署一个统一的资源调度管理框架YARN,在YARN之上可以部署其他各种计算框架
由YARN为这些计算框架提供统一的资源调度管理服务，并且能够根据各种计算框架的负载需求，调整各自占用的资源，实现集群资源共享和资源弹性收缩

离线计算框架：MapReduce
DAG计算框架：Tez 有向无环图适合编写有依赖关系的作业
流式计算框架：Storm
内存计算框架：Spark【不读磁盘而直接在内存上计算】
图计算框架：Giraph

YARN的结构

ResourceManager：整个集群只有一个，负责集群资源的统一管理和调度
NodeManager：单个节点上的资源管理
ApplicationMaster：每个应用有一个，任务调度、监控与容错

ResourceManager（RM&

最低0.47元/天解锁文章

取个程序猿的名字

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据存储与处理——YARN

Yarn产生的原因直接源于MRv1在几个方面的缺陷扩展性受限单点故障：JobTracker 完成了太多的任务，造成了过多的资源消耗难以支持MR之外的计算多计算框架各自为战，数据共享困难YARN即在一个集群上部署一个统一的资源调度管理框架YARN,在YARN之上可以部署其他各种计算框架由YARN为这些计算框架提供统一的资源调度管理服务，并且能够根据各种计算框架的负载需求，调整各自...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。