Spark学习笔记(二)

部署图
 部署图
从部署图中可以看到

  • 整个集群分为 Master 节点和 Worker 节点,相当于 Hadoop 的 Master 和 Slave 节点。
  • Master节点上常驻 Master 守护进程,负责管理全部的Worker 节点。
  • Worker 节点上常驻 Worker 守护进程,负责与Master 节点通信并管理 executors。
  • Application 就是用户自己写的 Spark 程序(driver program),比如 WordCount.scala。如果 driver program 在Master 上运行,比如在 Master 上运行

./bin/run‐example SparkPi 10

那么 SparkPi 就是 Master 上的 Driver。如果是 YARN 集群,那么 Driver 可能被调度到 Worker 节点上运行(比如上
图中的 Worker Node 2)。

  • 每个 Worker 上存在一个或者多个 ExecutorBackend 进程。每个进程包含一个 Executor对象,该对象持有一个线程概览部署图 池,每个线程可以执行一个 task。 每个 application 包含一个 driver 和多个executors,每个 executor 里面运行的 tasks 都属于同一个 application。
  • Standalone版本中,ExecutorBackend 被实例化成 CoarseGrainedExecutorBackend 进程。

我们使用重点内容 Spark 自带的 examples 包中的 GroupByTest,假设在 Master 节点运行,命令是

bin/run‐example GroupByTest 100 10000 1000 36

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值