8.1.CentOS7安装Spark安装部署及standalone模式介绍

python编程快速上手(持续更新中…)

推荐系统基础


一、目标

  • 知道Spark的安装过程,知道standalone启动模式
  • 知道spark作业提交集群的过程

二、spark 安装部署

1.下载

spark: 版本spark2.2.0, 下载地址:http://archive.apache.org/dist/spark/spark-2.2.0/
,下载spark-2.2.0-bin-hadoop2.6.tgz

2.安装

a.spark解压到/opt下,并分别重名为scala2118,spark22,然后配置环境变量,具体如下:

tar -zxvf spark-2.2.0-bin-hadoop2.6.tgz -C /opt/

cd /opt

mv spark-2.2.0-bin-hadoop2.6/ spark

b.配置spark环境变量spark-env.sh(需要将spark-env.sh.template重命名)

cd spark/conf

mv spark-env.sh.template spark-env.sh

vi spark-env.sh

export SPARK_HOME=/opt/spark
export JAVA_HOME=/opt/jdk8
export HADOOP_HOME=/opt/hadoop
export YARN_HOME=/opt/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HADOOP_CONF_DIR=$YARN_HOME/etc/hadoop
export SPARK_MASTER_IP=172.18.2.2
export SPARK_LIBRARY_PATH=$HADOOP_HOME/lib/native
export SPARK_LOCAL_DIRS=/opt/spark/tmp

c.修改slaves配置文件

# 步骤一:将slaves.template这个文件重新命名为slaves:
mv slaves.template slaves
 
# 步骤二:修改slaves配置文件中的内容,在里面添加worker节点的地址
# 配置从节点的地址(默认)
localhost

d.配置Spark环境变量
打开/etc/profile,在该文件中添加如下内容:

#配置Spark环境变量
export SPARK_HOME=/opt/modules/spark-2.2.0
export PATH=$SPARK_HOME/bin:$PATH

让配置生效:

source /etc/profile

3.启动和使用

a.进入到$SPARK_HOME/sbin目录

  • 启动

./start-all.sh

  • jps查看进程

60056 Master
60137 Worker

  • 通过SPARK WEB UI查看Spark集群及Spark

http://172.18.2.2:8080/ 监控Spark集群
http://172.18.2.2:4040/ 监控Spark Job

  • 关闭

./stop-all.sh

b.进入到$SPARK_HOME/bin目录

spark-shell

三、spark 集群相关概念

1.spark集群架构(Standalone模式)

在这里插入图片描述

2.Spark作业相关概念

  • Master
    • 主节点
    • 负责Worker状态管理
    • 响应client提交来的Application
  • Worker
    • 管理自身资源
    • 运行Applicatoib对应的task
    • 启动图driver执行application
  • Excutor
    • task最终执行的容器
  • Application
    • spark作业
  • Diver
    • 作业提交给spark的时候先由一个Worker启动一个Driver来分析Application
    • DAGScheduler
      • tash划分交给TaskScheduler
      • 作用可以划分多个stage
      • 每一个stage根据partion的 数量觉得由多个task
  • TaskScheduler
    • 将task调度到对应的Excutors上执行
  • Clent

3.Spark作业图

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值