Win10下快速搭建spark

最新推荐文章于 2021-10-18 22:03:05 发布

weixin_30367873

最新推荐文章于 2021-10-18 22:03:05 发布

阅读量109

点赞数

文章标签：大数据 python scala

原文链接：http://www.cnblogs.com/momogua/p/9285930.html

版权

在win10下搭建spark，需要安装java的jdk，scala，spark，hadoop。

一、安装配置jdk

下载 jdk版本：jdk-8u151-windows-x64.exe

增加2个环境变量：

JAVA_HOME E:\Java\jdk1.8.0_151 （注意，这里把jdk安装的目录，不是C盘的默认目录，路径中不能有空格）

CLASSPATH %JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar

在系统环境变量Path中，在原来基础上加：%JAVA_HOME%\bin

二、安装配置scala

访问官方地址http://www.scala-lang.org/download/2.11.8.html

下载：scala-2.11.8.msi

在系统环境变量 Path 中，增加：C:\Program Files (x86)\scala\bin

三、安装配置spark

1、下载spark

访问官方地址http://spark.apache.org/downloads.html

下载文件：spark-2.2.0-bin-hadoop2.7.tgz

2、解压tgz文件

我把文件解压到目录：D:\spark-2.2.0-bin-hadoop2.7

在这个目录下，有 bin等文件夹。

3、配置

添加系统环境变量：

SPARK_HOME D:\spark-2.2.0-bin-hadoop2.7

在系统环境变量Path增加：%SPARK_HOME%\bin

四、安装配置hadoop

1、下载hadoop

访问官方http://hadoop.apache.org/releases.html

可以下载 2.7.6版的binary文件

但是，我在安装的时候，直接百度，找了 hadoop2.7.1的压缩文件。

在bin目录中，包含了：hadoop.dll , winutils.exe ,这2个文件就够用了。

然后解压为：D:\hadoop2.7.1

2、配置

增加系统环境变量：

HADOOP_HOME D:\hadoop2.7.1

在系统环境变量Path增加：%HADOOP_HOME%\bin

3、下载winutils

下载路径：https://github.com/steveloughran/winutils

五、配置pyspark

在搭建spark环境之前，安装了Anaconda，包含了python，为了使用pyspark：

1、把 D:\spark-2.2.0-bin-hadoop2.7\python 复制到 E:\Anaconda3\Lib\site-packages 路径下。

2、通过pip install py4j 安装 py4j。

3、修改权限 winutils.exe chmod 777 D:\tmp\Hive，在运行命令前先创建目录 D:\tmp\Hive 。

4、配置

增加系统环境变量： PYTHONPATH %SPARK_HOME%\python\lib\py4j;%SPARK_HOME%\python\lib\pyspark;E:\Anaconda3;

在系统环境变量Path，增加：E:\Anaconda3

六、验证

启动cmd，输入： pyspark

或者输入：spark-shell

转载于:https://www.cnblogs.com/momogua/p/9285930.html

weixin_30367873

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。