Spark笔记整理2——Spark架构及执行流程

1.关键词了解
关于对Spark的关键词的解释,官网有很详细的描述,地址如下:
spark名词解释

名字解释
Applicationspark中比较大的概念,是一个基于spark的应用程序,包括Driver和Executors
Application jar需要我们开发的应用程序的jar包
Driver program包括运行程序的主函数和SparkContext(上下文环境)
Cluster manager得到集群资源的外部服务如yarn等
Deploy modeDriver运行位置,分为client和cluster
Worker node工作节点,在yarn中相当于NM
Executor在工作节点上为该应用程序启动的进程,用于运行任务,并将数据保存在内存或磁盘,不同应用程序之间Executor互相无联系。
TaskExecutor的基本执行单元
Job作为一个任务,每一个action操作就是一个job,作为一次计算序列
Stage每次shuffle操作将job一分为二个stage。

2.Spark架构图

这里写图片描述

总结:

  • 每个应用程序的都有自己的Executor,他们相互独立,互不通信,数据不能在应用程序之间共享
  • 平台无关性,Spark不关注运行平台是什么,只要可以获取执行进程,并且自己可以相互通信就可以。也就是说底层资源管理程序可以为yarn等
  • Driver端必须要监听Executor端运行状况
  • Driver端不能远离工作节点

这里写图片描述

从这个稍微详细的图中我们可以了解到一些东西:

  • Driver端先向集群管理的应用程序来申请资源,然后才能启动Executor,分配task。
  • 在整个执行的流程,Driver和集群管理的应用程序(yarn等)都监控着task和Executer的状态
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值