window环境下安装spark

最新推荐文章于 2024-07-21 20:58:36 发布

FTDdata

最新推荐文章于 2024-07-21 20:58:36 发布

阅读量3.4k

点赞数 5

分类专栏： spark 文章标签： spark 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jhr112/article/details/115206629

版权

spark 专栏收录该内容

1 篇文章 1 订阅

订阅专栏

spark是大数据计算引擎，拥有Spark SQL、Spark Streaming、MLlib和GraphX四个模块。并且spark有R、python的调用接口，在R中可以用SparkR包操作spark，在python中可以使用pyspark模块操作spark。本文介绍spark在window环境下的安装。

0 环境

先给出安装好后的各个软件版本:

win10 64bit
java 1.8.0
scala 2.12.8
hadoop 2.7.1
spark 2.4.1

1 java安装

下载

spark依赖java，首先电脑中必须安装java。

地址：https://www.oracle.com/java/technologies/javase-jdk8-downloads.html

在这里插入图片描述

根据系统下载对应的jdk，下载后双击exe文件进行安装，可选择安装位置。

环境变量配置

依次点击我的电脑 ->属性->高级系统设置->环境变量，在系统变量选项卡中，新建一个系统变量，如下，变量名为JAVA_HOME，变量值为本地安装java的路径。

在这里插入图片描述

添加好JAVA_HOME后，需要为Path变量增加值，选择Path变量（同样在系统变量中），点击编辑，弹出如下弹窗，新建两个值，分别为%JAVA_HOME%\bin和%JAVA_HOME%\jre\bin。

在这里插入图片描述

添加好后，确定、保存。

测试

环境变量配置好后，测试java是否安装成功，win+R打开运行对话框，输入cmd命令进入命令行窗口，输入java -version查看java版本，有输出则说明java安装成功。

在这里插入图片描述

2 scala 安装

下载

spark是由scala语言编写的，需要安装scala。

地址：https://www.scala-lang.org/download/

在这里插入图片描述

根据系统下载对应的版本，进行安装，安装位置可自行选择。

环境变量配置

同样，在系统变量的Path中，增加一个值，为scala的安装路径。

在这里插入图片描述

测试

同样，打开命令行窗口，输入scala，出现如下界面表示安装成功。

在这里插入图片描述

3 hadoop安装

下载

地址：http://hadoop.apache.org/releases.html

下载，安装到本地。

需要注意的是hadoop的安装路径中不要有空格，例如不要放在Program Files文件夹下。

在这里插入图片描述

环境变量配置

新增HADOOP_HOME系统变量，值为本地hadoop安装路径。

在这里插入图片描述

增加Path系统变量的值，为%HADOOP_HOME%\bin

在这里插入图片描述

4 spark安装

下载

下载地址：http://spark.apache.org/downloads.html

下载，然后本地安装。

在这里插入图片描述

需要注意的是spark版本需要和hadoop版本对应，如界面所示的spark 3.0.0对应hadoop 2.7。

环境变量配置

新增SPARK_HOME系统变量，值为本地spark安装路径。

在这里插入图片描述

增加Path系统变量的值，为%SPARK_HOME%\bin。

在这里插入图片描述

测试

在命令行窗口，输入spark-shell，出现如下界面，表示spark安装成功。

在这里插入图片描述

spark window单机版安装成功！单机版可以用来学习spark的基础使用，python用户可以用pyspark模块使用spark，R用于可以用SparkR包使用spark。

关注

5
点赞
踩
49

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

FTDdata CSDN认证博客专家 CSDN认证企业博客

码龄13年

40: 原创

5万+: 周排名

109万+: 总排名

32万+: 访问

: 等级

2495: 积分

78: 粉丝

91: 获赞

38: 评论

703: 收藏

私信

关注

热门文章

分类专栏

Python 23篇
R语言 15篇
spark 1篇
markdown 1篇

最新评论

python--pandas样式
和而不同349: 我写的代码，style什么命令都不执行，这个是为啥呢
网页版R--RStudio Server
嘟嘟哒哒啦: 你可以将本地文件通过Mobaxterm上传至服务器，然后网页版的RStudio就可以读取到了
window环境下安装spark
m0_64274637: 为什么我的spark-spell显示是没有内部或者外部命令也不是可执行的命令我环境变量都配好了
网页版R--RStudio Server
weixin_44335331: 请问博主，我的文件怎么上传到Rstudio在线的服务器上？还是说这个服务器版本能读取和处理我在本地的文件？谢谢
Python--并行计算框架（pathos）
木卜365: 代码运行不出来，提示No module named 'parallel'

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。