standalone模式下 spark 集群搭建完成之后work进程没有起来

最新推荐文章于 2022-12-28 22:34:40 发布

龙城烟雨

最新推荐文章于 2022-12-28 22:34:40 发布

阅读量2k

点赞数 1

分类专栏： spark 文章标签： spark 的work未启动 spark 的独立模式

本文链接：https://blog.csdn.net/qq_40215763/article/details/82698984

版权

spark 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

无法启动：nice -n 0 / home / hadoop / soft / spark / bin / spark-class org.apache.spark.deploy.worker.Worker –webui-port 8081 spark：// master：7077

好久没搭建spark 集群了，今天搭建了一下spark集群的 standalone 模式之后，发现在

[hadoop@master sbin]$ ./start-all.sh

启动spark的进程时，突然就发生一下错误：

starting org.apache.spark.deploy.master.Master, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.master.Master-1-master.out
slave3: starting org.apache.spark.deploy.worker.Worker, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave3.out
slave1: starting org.apache.spark.deploy.worker.Worker, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave1.out
slave2: starting org.apache.spark.deploy.worker.Worker, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave2.out
slave3: failed to launch: nice -n 0 /home/hadoop/soft/spark/bin/spark-class org.apache.spark.deploy.worker.Worker --webui-port 8081 spark://master:7077
slave3: full log in /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave3.out
slave2: failed to launch: nice -n 0 /home/hadoop/soft/spark/bin/spark-class org.apache.spark.deploy.worker.Worker --webui-port 8081 spark://master:7077
slave2: full log in /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave2.out
slave1: failed to launch: nice -n 0 /home/hadoop/soft/spark/bin/spark-class org.apache.spark.deploy.worker.Worker --webui-port 8081 spark://master:7077
slave1: full log in /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave1.out

经过打印的日志信息分析可以看到：
failed to launch：nice -n 0 / home / hadoop / soft / spark / bin / spark-class org.apache.spark.deploy.worker.Worker –webui-port 8081 spark：// master：7077
看到这句话是说：无法启动这个进程，于是乎我去检查了我的spark的节点配置信息，在

/spark/conf/slaves
slave1 #配置的节点
slave2
slave3

这个没问题，其它节点经过检查也是好的，那问题就是在环境变量上了

[hadoop@slave1 ~]$ vim ~/.bashrc

# Source global definitions
if [ -f /etc/bashrc ]; then
        . /etc/bashrc
fi

# User specific aliases and functions

export JAVA_HOME=/home/hadoop/soft/jdk

export HADOOP_HOME=/home/hadoop/soft/hadoop

export ZOOKEEPER_HOME=/home/hadoop/soft/zoo

export HBASE_HOME=/home/hadoop/soft/hbase

export HIVE_HOME=/home/hadoop/soft/hive

export SPARK_HOME=/home/hadoop/soft/spark

export FLUME_HOME=/home/hadoop/soft/flume

export KAFKA_HOME=/home/hadoop/soft/kafka

PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin:$PATH:$HBASE_HOME/bin:$HIVE_HOME/bin:$SPARK_HOME/bin:$FLUME_HOME/bin:$KAFKA_HOME/bin:$HOME/bin
export PATH

环境变量前后检查了一遍，没问题重新source一遍

source ~./bashrc

完成之后，在

/spark/conf/sbin/

下执行

[hadoop@master sbin]$ ./stop-all.sh
slave2: stopping org.apache.spark.deploy.worker.Worker
slave1: stopping org.apache.spark.deploy.worker.Worker
slave3: stopping org.apache.spark.deploy.worker.Worker
stopping org.apache.spark.deploy.master.Master

执行完成之后，重新启动关于spark的进程


[hadoop@master sbin]$ ./start-all.sh
starting org.apache.spark.deploy.master.Master, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.master.Master-1-master.out
slave3: starting org.apache.spark.deploy.worker.Worker, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave3.out
slave1: starting org.apache.spark.deploy.worker.Worker, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave1.out
slave2: starting org.apache.spark.deploy.worker.Worker, logging to /home/hadoop/soft/spark/logs/spark-hadoop-org.apache.spark.deploy.worker.Worker-1-slave2.out


[hadoop@slave1 ~]$ jps
2635 Jps
2510 Worker
[hadoop@slave1 ~]$ exit
logout
Connection to slave1 closed.
[hadoop@master sbin]$ ssh slave2
Last login: Fri Sep 14 09:43:00 2018 from master
[hadoop@slave2 ~]$ jps
2667 Jps
2511 Worker
[hadoop@slave2 ~]$ exit
logout
Connection to slave2 closed.
[hadoop@master sbin]$ ssh slave3
Last login: Fri Sep 14 09:43:12 2018 from master
[hadoop@slave3 ~]$ jps
2246 Worker
2665 Jps
[hadoop@slave3 ~]$

spark 的work进程在其它节点上都启动了！

分析结果

1.配置环境变量完成之后一定要 source ~/.bashrc （我一般配置在~/.bashrc 中，你的按情况而定）
2.启动 [hadoop@master sbin]$ ./start-all.sh 未成功一定要关闭进程在重新排查
3.source ~/.bashrc 之后在去/spark/sbin中 ./start-all.sh

龙城烟雨

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
standalone模式下 spark 集群搭建完成之后work进程没有起来

无法启动：nice -n 0 / home / hadoop / soft / spark / bin / spark-class org.apache.spark.deploy.worker.Worker –webui-port 8081 spark：// master：7077好久没搭建spark 集群了，今天搭建了一下spark集群的 standalone 模式之后，发现在 ...
复制链接

扫一扫