Spark的运行模式讲解

本文详细介绍了Spark在YARN上的两种运行模式:yarn-client和yarn-cluster。yarn-client模式下,ApplicationMaster不运行SparkContext,而是与SparkContext通信进行资源分配;而yarn-cluster模式中,Driver运行在ApplicationMaster中,负责任务调度,提交任务后客户端可关闭,适合批处理任务。
摘要由CSDN通过智能技术生成

一、背景

yarn是hadoop体系中的资源调度管理机制,在上面可以运行多套计算框架比如MapReduce;同样也支持Spark。这不仅使得应用程序部署更加方便,也是用户的在yarn集群中运行的服务和Application的资源管理也完全隔离。更具有价值的是yarm通过队列的方式,同时管理集群中的多个服务。

二、yarn-client模式

1.yarn-client运行流程图

在这里插入图片描述

2.yarn-client的工作流程

  1. 启动应用程序,在SparkContext创建过程中、会初始化DAGScheduler、YarnScheduler、YarnClientSchedulerBackend等调度器。并且YarnClientSchedulerBackend会在内部启动DriverEndpoint和CLient。然后Client会向Yarn集群的ResourceManager申请启动ApplicationMaster。
  2. ResourceManager收到请求会在集群中选取一个NodeManager,为这个应用程序分配第一个Container,并在这个Container中启动ApplicationMaster;与yarn-cluster的区别是这个ApplicationMaster不运行SparkContext,只会与SparkContext联系进行资源分配。
  3. SparkContext启动完成后会与ApplicationMaster建立通信,Applicati
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值