CentOS 7上安装Spark 2.2单机

最新推荐文章于 2024-09-05 14:11:37 发布

苍穹逸鸿

最新推荐文章于 2024-09-05 14:11:37 发布

阅读量1.7k

点赞数 1

分类专栏： Spark 文章标签： CentOS 7 spark centos jdk python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leon_founder/article/details/78715831

版权

Spark 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Spark 2.2 需要运行在java环境，是不是任何版本都可以呢？不见得。之前在spark官网中看到需要运行环境是jdk8+，所以本人安装了jdk9，但是在JDK 9环境下没有安装成功，运行spark的 ./bin/spark-shell会报某个配置值丢失（估计是JDK版本的问题）。这次安装时，选择了jdk 8，安装后运行正常。下面简单记录一下安装的过程，比较简单。

1. 下载Jdk，http://www.oracle.com/technetwork/java/javase/downloads/index.html，选择JDK 8 下载

2. 安装JDK 8。rpm -ivh jdk-8u151-linux-x64.rpm

3. 设置JAVA_HOME. 在/etc/profile最后增加如下两行

export JAVA_HOME=/usr/java/jdk1.8.0_151
export PATH=$PATH:$JAVA_HOME/bin

根据自己安装的实际目录去设置java home。

4. 下载Spark。 http://spark.apache.org/downloads.html

选择2.2.0版本，包类型选择默认的“Pre-built for Apache Hadoop 2.7 and later”

5. Copy至要安装的目录下，解压缩

tar zxvf spark-2.2.0-bin-hadoop2.7.tgz

6. 运行Spark

./sbin/start-master.sh

检查logs中的日志，是否有错误

7. 运行spark-shell

./bin/spark-shell

没有错误的话就安装成功了。

另外，如果是使用的Python的话，可以安装Python，然后运行./bin/pyspark。本人在Python 3.6.3上安装成功。以下是安装Python 3.6简单操作

8. 下载Python 3.6

https://www.python.org/ftp/python/3.6.3/Python-3.6.3.tar.xz

9. 安装xz解压工具

yum install xz

10. 解压安装包

xz -d Python-3.6.3.tar.xz
tar xvf Python-3.6.3.tar

11. 编译及安装可参见不畏惧兄的博客 http://www.cnblogs.com/cloud-80808174-sea/p/6902934.html

其中需要注意的是，在Spark 2.10版本以后不再支持Python2.7，所以在安装完Python3.6.3后，需要把3.6.3设为默认，在不畏惧兄的博客中有写如何更改。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。