Spark的安装以及配置

最新推荐文章于 2023-06-08 22:02:18 发布

independenceY

最新推荐文章于 2023-06-08 22:02:18 发布

阅读量331

点赞数

本文链接：https://blog.csdn.net/independenceY/article/details/90582474

版权

本文详细介绍了如何安装配置Spark和Scala，包括从官网下载、解压、启动，以及在Hadoop环境下启动Spark。接着通过一个WordCount的实例，展示了如何使用Spark-shell进行交互式编程，计算单词出现次数，并将结果保存到本地。最后，给出了运行结果和退出操作的步骤。

摘要由CSDN通过智能技术生成

Spark的安装以及配置

1、官网下载安装Scala：scala-2.12.8.tgz
https://www.scala-lang.org/download/
tar -zxvf scala-2.12.8.tgz -C /opt/module
mv scala-2.12.8 scala
测试：scala -version
启动：scala

2、官网下载安装Spark：spark-2.4.2-bin-hadoop2.7.tgz
https://www.apache.org/dyn/closer.lua/spark/spark-2.4.2/spark-2.4.2-bin-hadoop2.7.tgz
解压、重命名
启动spark
①先启动hadoop 环境
start-all.sh
②启动spark环境
进入到SPARK_HOME/sbin下运行start-all.sh
/opt/module/spark/sbin/start-all.sh
[注] 如果使用start-all.sh时候会重复启动hadoop配置，需要./在当前工作目录下执行命令
jps 观察进程多出 worker 和 mater 两个进程。
查看spark的web控制页面：http://bigdata1