spark内核架构

application = driver+executor


Driver部分的代码:SparkConf+SparkContext


---Driver代码部分:---

val conf = new SparkConf()

val sc = new SparkContext(conf)

----------   end   ---------

---executor部分代码,分布到集群中的代码---

比如 textFile flatMan  map 


worker 管理当前的note的资源,并接受master的指令来分配具体的计算资源Executor(在新的进程中分配)

ExecutorRunner 管理进程,创建进程

Worker 发心跳给Master只有id,不会汇报资源信息

Worker在Master注册时就已经汇报过资源信息

Worker只有故障时才汇报资源情况


Spark 速度快的原因,不是基于内存计算,而主要是他的调度和容错等

Stage 内部:计算逻辑完全一样只是计算的逻辑不同罢了,这是分布式计算的基本

一个Application里面可以有多个Jobs 

一般一个action里有一个jobs

Spark的程序运行有两种运行模式:Client Cluster  一般是Client模式

Worker 上做driver 是Cluster模式


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值