Linux下spark独立集群（单机）环境部署

最新推荐文章于 2024-04-27 21:15:40 发布

流年ln

最新推荐文章于 2024-04-27 21:15:40 发布

阅读量488

点赞数

分类专栏：大数据文章标签： spark 独立集群

本文链接：https://blog.csdn.net/admin_15082037343/article/details/107798400

版权

大数据专栏收录该内容

4 篇文章 0 订阅

订阅专栏

如果你没有hadoop环境，先参考
https://blog.csdn.net/admin_15082037343/article/details/107498074

spark环境

获取部署包
官网下载spark的部署包，http://spark.apache.org/，笔者写这篇文章的时候，spark最新版本是3.0.0。
上传到Linux服务器并解压
配置环境变量

vi /etc/profile

# 将下面这两句加入环境变量，为了方便
export SPARK_HOME=/opt/tools/spark-3.0.0-bin-hadoop3.2
export PATH=$SPARK_HOME/bin:$PATH

# 重启环境变量
source /etc/profile

修改配置文件

在${SPARK_HOME}/conf下，有几个重要的配置文件

spark-env.sh

export JAVA_HOME=/opt/tools/jdk1.8.0_212
# 这是主节点的机器名称
export SPARK_MASTER_HOST=server
export SPARK_MASTER_PORT=7077
export HADOOP_HOME=/opt/tools/hadoop-3.2.1
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export LD_LIBRARY_PATH=$HADOOP_HOME/lib/native:$LD_LIBRARY_PATH

slaves

server

这里是机器名称，表示自己点所在机器，每一行一个机器名称，可以一次性启动所有子节点。

备注：这些文件可能没有，原本的这些文件是.template结尾的，只是把这些文件复制过来的

hive-site.xml和spark-env.sh以后再说

启动

${SPARK_HOME}/sbin目录下，

start-all.sh

验证

jps

浏览器输入：http://server:8080/

流年ln

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
Linux下spark独立集群（单机）环境部署

如果你没有hadoop环境，先参考https://blog.csdn.net/admin_15082037343/article/details/107498074spark环境获取部署包官网下载spark的部署包，http://spark.apache.org/，笔者写这篇文章的时候，spark最新版本是3.0.0。上传到Linux服务器并解压配置环境变量vi /etc/profile# 将下面这两句加入环境变量，为了方便export SPARK_HOME=/opt/
复制链接

扫一扫