菜鸟先飞之spark安装配置

最新推荐文章于 2024-07-25 10:54:12 发布

年纪轻轻却聪明绝顶

最新推荐文章于 2024-07-25 10:54:12 发布

阅读量282

点赞数

文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangbenguixin/article/details/107759622

版权

接受了诸多软件的的毒打，想必spark算是简单的配置了，话不多说，让我们随便戳戳！

一、安装准备

1、首先检查是否安装了 jdk, 和版本是否符合要求。

2、准备 spark-2.2.0-bin-hadoop2.7.tgz 安装文件

3、将文件拖入专门安装软件的soft文件夹（这个可以随意）

4、解压文件:tar -zxf spark-2.2.0-bin-hadoop2.7.tgz

5、给文件改个名好吧：mv zxf spark-2.2.0-bin-hadoop2.7 spark

二、配置spark环境变量

vi /etc/profile

ps:以下是我的安装路径，若有变动，请自行调整

export SPARK_HOME=/opt/soft/spark

export PATH=$SPARK_HOME/bin:$PATH

三、修改配置文件

切换至 spark 的 conf 目录：cd /opt/soft/spark/conf

复制当前目录下的spark-env.sh.template文件并改名：cp spark-env.sh.template spark-env.sh

在任意位置新增（我通常都放末尾 shift + g 跳转至文件末尾）

export HADOOP_CONF_DIR=/opt/soft/hadoop/etc/hadoop

# jdk安装目录

export JAVA_HOME=/opt/soft/java8

# hadoop 安装目录

export HADOOP_HOME=/opt/soft/hadoop

# 指定master的主机

export SPARK_MASTER_HOST=hqj

# 指定master的端口,虽然默认端口就是7077

export SPARK_MASTER_PORT=7077

ps:使spark运行在yarn上，必配，否则连不上YARN，并访问不了HDFS，并且要求HADOOP环境变量已正确配置；jdk的最好也写一下，否则可能会报出异常

若是完全分布式，则还需要修改slaves.template

修改文件名：mv slaves.template slaves

修改配置文件：vi slaves

shift +g 新增主机名就OK了

四、启动Spark Standalone集群

sbin/start-all.sh

ps:确保在spark目录下

若正常运行让我们 jps 一下查看进程出现了 worker 和 Master 就成功了一半

五、运行spark

spark-shell --master yarn

或者启动spark-shell 测试scala交互式环境：spark-shell --master spark://localhost:7077

本地模式运行：spark-shell

ps:这边的localhost最好改成虚拟机的ip地址，这样更稳妥，有小伙伴说hostname也可以，大家自行参考吧！

年纪轻轻却聪明绝顶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
菜鸟先飞之spark安装配置

接受了诸多软件的的毒打，想必spark算是简单的配置了，话不多说，让我们随便戳戳！一、安装准备1、首先检查是否安装了 jdk, 和版本是否符合要求。2、准备 spark-2.2.0-bin-hadoop2.7.tgz 安装文件3、将文件拖入专门安装软件的soft文件夹（这个可以随意）4、解压文件::tar -zxfspark-2.2.0-bin-hadoop2.7.tgz5、给文件改个名好吧：mvzxfspark-2.2.0-bin-hadoop2.7 spark...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。