yarn的cluster和client

最新推荐文章于 2024-08-06 23:23:33 发布

尘世壹俗人

最新推荐文章于 2024-08-06 23:23:33 发布

阅读量661

点赞数

分类专栏：大数据Hadoop技术文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dudadudadd/article/details/111612116

版权

大数据Hadoop技术专栏收录该内容

29 篇文章 0 订阅

订阅专栏

首先对于cluster和client这两种模式我们要知道几个事
1、你如果是跑Hadoop自己的MapReduce，那么不必要讨论它是用的那种模式，因为MR运行可以说就是cluster
2、cluster和client这两个模式是yarn为其他框架提出的两种可供选择的运行模式，运行时Hadoop提供applicationmaster等用来进行资源调度的组件，至于任务的具体执行等具体细节是由不同框架自己的Driver决定的，和Hadoop集群没关系
3、于hadoop和其他的计算框架对比，我们所说的driver节点，在思路上家一定要清楚的知道不是一类东西，hadoop的driver主要有两个任务，一个是在任务提交的时候进行任务规划，另一个是在任务的进行中做一些合并等任务的善后操作，而其他框架的driver所以说就是我们手写的代码部分，本身比较独立和完善

Yarn-cluster模式提交作业后，applicationmaster和相应的Driver节点会按照原MapReduce执行原理中那样生成在一台集群中的机器上，适合生产环境
Yarn-client时，Driver节点会在你提交任务的那一台服务器的上产生，适合测试环境。

就spark为例，Spark on Yarn任务，其实就是Spark Driver在哪里运行、谁进行调度的区别

Yarn-cluster模式，Spark Driver运行在 Application Master所在的机器上，该机器是Spark集群中某个节点

Yarn-client模式,Spark Driver运行在 Client所在的机器，就是Spark提交任务的那台节点上

尘世壹俗人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。