Spark 中 Yarn 运行模式

本文介绍了Spark在YARN上的两种运行模式:集群模式和客户端模式。在YARN集群模式中,Driver运行在Application Master上,客户端在提交作业后可以关闭;而在客户端模式中,Driver运行在客户端,客户端在整个过程保持运行并与Executor通信。YARN集群模式适合生产环境,客户端模式适用于交互和调试。
摘要由CSDN通过智能技术生成

简介

spark 的 yarn 运行模式根据 Driver 在集群中的位置分成两种:

1)yarn-client 客户端模式

2)yarn-cluster 集群模式

yarn 模式和 standalone 模式不同,standalone 模式需要启动 spark 独立集群,这样 SparkContext 才能与 Master 进行交互通信。而 yarn 模式的资源管理全部托管给的 ResourceManager 了,所以它不需要启动 spark 独立集群,那么也就意味着你无法访问 http://master:8080 这个页面了。

 

yarn 集群模式

spark 的 yarn 集群模式,Driver 运行在 Application Master 上,Application Master 进程同时负责驱动我们的代码程序和从 ResourceManager 申请资源。由于它直接运行在 yarn 的 Container 当中,所以并不需要客户端,客户端可以在提交完毕之后就关闭,如图:

1)客户端将生成作业信息并提交给 ResourceManager

2)ResourceManager 会选择一个 NodeManager 去启动 container,并且把 ApplicationMaster 分配给它去运行

3)NodeManager 接收到以后就会启动 ApplicationMaster 并初始化 dag 作业,此时 NodeManager 就成为 Driver

4࿰

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值