spark启动命令_最新版Spark v2.4.3详细安装过程以及Spark Shell命令行操作演示

最新推荐文章于 2024-04-15 02:24:27 发布

xingming Zhenshi

最新推荐文章于 2024-04-15 02:24:27 发布

阅读量815

点赞数

文章标签： spark启动命令

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30636449/article/details/113450253

版权

本文详细介绍了Apache Spark v2.4.3的安装步骤，包括下载安装文件、配置相关文件、验证安装成功以及启动Spark Shell。通过Spark Shell，演示了读取本地及HDFS文件、词频统计等操作，为Spark初学者提供了实践指导。

摘要由CSDN通过智能技术生成

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。它的特点是多个任务之间数据通信不需要借助硬盘而是通过内存，大大提高了程序的执行效率。

Spark中间计算结果直接放到内存中，带来了更高的迭代运行效率。
Spark基于DAG(Directed Acyclic Graph)的任务调度执行机制，要优于MapReduce的迭代执行机制。

下面详细介绍了Spark v2.4.3 最新版详细安装过程以及Spark Shell 命令行操作演示。

一、下载最新版Spark 安装文件

下载URL：

https://spark.apache.org/downloads.html

因为我们已经自己安装了Hadoop，这里选择Pre-build with user-provided Apache Hadoop，也就是使用自己已经安装的Hadoop。

Spark可以独立安装使用，也可以和Hadoop一起安装使用。这样，我们采用和Hadoop一起安装使用，这样就可以让Spark使用HDFS存取数据。需要说明的是，当安装好Spark以后，里面就自带了scala环境，不需要额外安装scala。

从spark官网下载超级慢，可以从国内镜像站点下载：

https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.4.3/

执行如下下载命令：

wget https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.4.3/spark-2.4.3-bin-without-hadoop.tgz

Spark Maven 依赖，之后开发Java 应用时会需要，可以先保存一下。

grou

最低0.47元/天解锁文章

xingming Zhenshi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark启动命令_最新版Spark v2.4.3详细安装过程以及Spark Shell命令行操作演示

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。它的特点是多个任务之间数据通信不需要借助硬盘而是通过内存，大大提高了程序的执行效率。Spark中间计算结果直接放到内存中，带来了更高的迭代运行效率。Spark基于DAG(Directed Acyclic Graph)的任务调度执行机制，要优于MapReduce的迭代执行机制。下面详细介绍了Spark v2.4.3 最新版详细...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。