大数据IMF传奇行动绝密课程第12课：HA下的Spark集群工作原理解密

最新推荐文章于 2020-06-04 17:14:20 发布

tom_8899_li

最新推荐文章于 2020-06-04 17:14:20 发布

阅读量411

点赞数

分类专栏： Spark 文章标签： spark

本文链接：https://blog.csdn.net/tom_8899_li/article/details/52187206

版权

Spark 专栏收录该内容

69 篇文章 0 订阅

订阅专栏

HA下的Spark集群工作原理解密

Zookeeper中包含的内容有哪些：所有的Worker Driver Application
图12-1 Spark高可用HA架构
下载Zookeeper
环境变量：

export ZOOKEEPER_HOME=

加入PATH
解压并创建logs/ 和data/

cp conf/zoo_sample.cfg conf/zoo.cfg
vi conf/zoo.cfg
#加入/修改以下内容
dataDir=/home/hadoop/zookeeper-3.4.6/data
dataLogDir=/home/hadoop/zookeeper-3.4.6/logs
server.0=Master:2888:3888
server.1=Worker1:2888:3888
server.2=Worker2:2888:3888

cd data/
echo 0 > myid

#拷贝到其他机器
scp -r zookeeper-3.4.6 hadoop@Worker1:/home/hadoop/
scp -r zookeeper-3.4.6 hadoop@Worker2:/home/hadoop/

#修改Worker1和Worker2的myid

启动：

bin/zkServer.sh start

#spark支持zookeeper
cd $SPARK_HOME/conf
vi spark-env.sh
注释掉#SPARK_MASTER_ID并加入以下内容：
SPARK_DAEMON_JAVA_OPT="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.u
rl=Master:2181,Worker1:2181,Worker2:2181 -Dspark.deploy.zookeeper.dir=/spark"

scp $SPARK_HOME/conf/spark-env.sh hadoop@Worker1:$SPARK_HOME/conf/
scp $SPARK_HOME/conf/spark-env.sh hadoop@Worker2:$SPARK_HOME/conf/

#启动Master上面的Spark

#启动Worker1和Worker2的Spark，这时Worker1和Worker2的jps中有Master进程，并且在控制台中能看到状态为Standby

提交任务要给三台机器

./spark-shell --master spark://Master:7077,Worker1:7077,Worker2:7077

把Master的Spark停掉以后，zookeeper会重新选择新的Master，例如为Worker1，如果重新打开Master的Spark后则不会重新变为Active的。

tom_8899_li

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据IMF传奇行动绝密课程第12课：HA下的Spark集群工作原理解密

HA下的Spark集群工作原理解密Zookeeper中包含的内容有哪些：所有的Worker Driver Application 下载Zookeeper 环境变量：export ZOOKEEPER_HOME=加入PATH 解压并创建logs/ 和data/cp conf/zoo_sample.cfg conf/zoo.cfgvi conf/zoo.cfg#加入/修改以下内容dataD
复制链接

扫一扫