Windows10系统spark3.0.0配置

最新推荐文章于 2024-06-03 16:25:36 发布

神马会员

最新推荐文章于 2024-06-03 16:25:36 发布

阅读量1.1k

点赞数 4

文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzq_tarena/article/details/134250173

版权

前言

Windows10系统基本环境：spark3.0.0+hadoop3.1.0+scala2.12.0+java jdk1.8。

一、配置java jdk1.8

1. jdk环境变量配置

环境变量配置路径：电脑→属性→高级系统设置→环境变量

path中加入：%JAVA_HOME%/bin。
注：jdk版本不宜过高。

2. 配置验证

cmd验证：

java -version

二、配置scala2.12.0

1.下载scala安装包

官方下载网址：https://www.scala-lang.org/

选择对应版本，这里我选择的是scala2.12.0版本。

下载Windows系统对应的压缩包。

2. 配置scala环境

环境变量配置路径：此电脑→属性→高级系统设置→环境变量

path中加入：%SCALA_HOME%/bin。

3. 验证配置

cmd验证配置：

scala -version

三、配置Hadoop3.1.0

1.Hadoop下载

从Apache官网下载Hadoop：https://hadoop.apache.org/
官网下载速度较慢，也可使用国内镜像下载。

2. Hadoop环境变量配置

配置步骤同Scala配置。

注意：需要把%HADOOP_HOME%\bin与%HADOOP_HOME%\sbin一同加入path中。

3. Windows系统bin下载：

windows系统需要替换hadoop安装包里的bin文件夹。

不同版本bin文件下载链接：https://gitee.com/tlbrun/hadoopWinutils/。
下载成功直接覆盖本地bin。

4. 配置Hadoop启动文档和脚本

配置\etc\hadoop\下的如下5个文件。

（1）在core-site.xml末尾加入如下代码，代码中路径按照自己本地路径相应修改：

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:8900</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>E:/soft/hadoop-3.1.0/tmp/${user.name}</value>

<description>A base for other temporary directories.</description>

</property>

</configuration>

（2）在hdfs-site.xml末尾加入如下代码，代码中路径按照自己本地路径相应修改：

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/namenode</value>

</property>

<property>

<name>fs.checkpoint.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/snn</value>

</property>

<property>

<name>fs.checkpoint.edits.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/snn</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/datanode</value>

</property>

</configuration>

（3）在yarn-site.xml末尾添加如下代码：

<configuration>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

</configuration>

（4）在mapred-site.xml末尾添加如下代码：

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

（5）在hadoop-env.cmd配置以下2个地方：

5. 启动Hadoop

进入hadoop目录：E:\soft\hadoop-3.1.0\bin，打开cmd，执行命令：

.\hdfs namenode -format

进入目录：E:\soft\hadoop-3.1.0\sbin，找到start-all.cmd，右键以管理员身份运行。
运行完毕可以看到以下四个服务：

四、配置Spark3.0.3

1. Spark下载

Spark3.0.3官网下载：

https://spark.apache.org/releases/spark-release-3-0-0.html

2. Spark环境配置

配置步骤同scala配置。

注意：需要把%SPARK_HOME%\bin与%SPARK_HOME%\sbin一同加入path中。

3. 配置验证

cmd命令：

spark-shell

Spark配置成功。

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
Windows10系统spark3.0.0配置

不同版本bin文件下载链接：https://gitee.com/tlbrun/hadoopWinutils/。注意：需要把%HADOOP_HOME%\bin与%HADOOP_HOME%\sbin一同加入path中。注意：需要把%SPARK_HOME%\bin与%SPARK_HOME%\sbin一同加入path中。从Apache官网下载Hadoop：https://hadoop.apache.org/官方下载网址：https://www.scala-lang.org/
复制链接

扫一扫

神马会员 CSDN认证博客专家 CSDN认证企业博客

码龄17年

1: 原创

76万+: 周排名

30万+: 总排名

1129: 访问

: 等级

15: 积分

8: 粉丝

4: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

Windows10系统spark3.0.0配置 1130

最新评论

Windows10系统spark3.0.0配置
CSDN-Ada助手: 恭喜您开始撰写博客！标题看起来很有吸引力，对于Windows10系统配置Spark3.0.0这个主题，我相信您一定有很多经验和知识可以分享。我期待着从您的博客中学到更多有关这方面的内容。在下一步的创作中，建议您可以结合自己的实践经验，分享一些配置过程中遇到的常见问题以及相应的解决方法，这样能够帮助读者更好地理解和应用。希望您能够继续保持谦虚的态度，期待您更多精彩的博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Windows10系统spark3.0.0配置
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/617529415。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。