Spark的一些问题汇总 及 Yarn与Spark架构的对比

1、Spark解决什么问题?

        海量数据的计算可以进行离线批处理以及实时流计算。

 

2、Spark有哪些模块?

        核心SparkCore、SQL计算(SparkSQL)、流计算(SparkStreaming)、图计算(Graphx)、机器学习(MLlib)

 

3、Spark有哪些特点?

        速度快、使用简单、通用性强、支持多种模式运行

 

4、Saprk的运行模式

        本地模式

        集群模式(StandAlone、YARN、K8S)

        云模式

 

5、Spark的运行角色(对比YARN)

        Master:集群资源管理(类同ResourceManager)

        Worker:单机资源模式(类同NodeManager)

        Driver:单任务管理者(类同ApplicationMaster)

        Executor:单任务执行者(类同YARN容器内的Task)

 

Yarn、Spark架构对比

1、YARN主要有4类角色,从两个层面去看:

# 资源管理层面

        1、集群资源管理者(Master):ResourceManger(RM)

        2、单机资源管理者(Worker):NodeManger

# 任务计算层面

        1、单任务管理者(Master):ApplicationMaster

        2、单任务执行者(Worker):Task(容器内计算框架的工作角色)

616b1d6de03c4ec5bb094e3b8bc42989.png

 

 2、Spark主要有4类角色,从两个层面去看:

# 资源管理层面

        1、集群资源管理者:Master

        2、单机资源管理者:Worker

# 任务计算层面

        1、单任务管理者:Driver

        2、单任务执行计算者:Executor (干活的)

e3068cc26e4744bfbf4d78b5aea224fd.png

 

 

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

木易巷

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值