standalone集群架构

集群管理器,cluster manager:Master 进程

工作节点:Worker进程

spark,Master+Worker集群架构就足够了,然后可以编写spark作业,提交到Master+Worker集群架构中运行

一般大公司,Hadoop、spark、storm、Hive、MapReduce都用到了,统一就不搭建spark集群了,(Master+Worker压根就没有)

 

YARN集群

直接部署一个spark客户端,部署一个spark安装包(解压缩+配置(hadoop的配置文件的目录 spark-env))

就可以提交spark作业给Yarn集群来运行作业

 

Master进程(cluster manager)

Worker进程(多个工作节点)

 

俩种deploy mode:

1. client:在哪台机器上,用spark submit提交spark作业,就会在哪台机器上启动driver进程

2. cluster模式:作业是提交给master,master找一台worker进程,启动driver

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值