[Spark 基础] 如何安装Spark和使用spark-shell

最新推荐文章于 2024-06-19 14:17:35 发布

我是个大bug

最新推荐文章于 2024-06-19 14:17:35 发布

阅读量862

点赞数 1

分类专栏： Spark 文章标签： spark 大数据教程

本文链接：https://blog.csdn.net/u013686990/article/details/102908861

版权

本文介绍如何在Linux/MacOS系统上安装Apache Spark，并通过spark-shell进行交互式编程。首先确保安装了Java，然后从官网下载Spark并解压。运行自带的Pi例子验证安装，了解Spark的local模式。接着，详细讲解了如何启动和使用spark-shell，通过读取文件、操作数据展示Spark的简单功能。最后提到了Spark的Web UI和不同语言的shell选项。

摘要由CSDN通过智能技术生成

背景

Apache Spark 是一个快速的、分布式的通用计算引擎，支持Java、Scala、Python和R多种语言，同时在计算引擎之上提供了多种工具，比如处理SQL和结构化数据的 Spark SQL，用于机器学习的 MLlib，用于图处理的 GraphX 和用于流计算的的 Spark Streaming。

在这篇文章里我们学习如何安装和启动Spark。

前置条件

一台Linux/MacOS系统
安装了Java（最好为JDK 8）

下载安装包

打开下载页面，这里选择了最新版本和Hadoop 2.7预构建版本：

下载页面

点击链接，获得镜像地址，在命令行用 wget 进行下载，下载后解压：

wget http://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.4.4/spark-2.4.4-bin-hadoop2.7.tgz
tar xvf spark-2.4.4-bin-hadoop2.7.tgz
cd spark-2.4.4-bin-hadoop2.7

运行example

安装好以后可以尝试运行一下自带的例子 SparkPi，计算圆周率，命令为：

$ bin/run-example SparkPi 10

最低0.47元/天解锁文章

我是个大bug

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
[Spark 基础] 如何安装Spark和使用spark-shell

文章目录背景前置条件下载安装包运行example运行模式使用spark-shell背景Apache Spark 是一个快速的、分布式的通用计算引擎，支持Java、Scala、Python和R多种语言，同时在计算引擎之上提供了多种工具，比如处理SQL和结构化数据的 Spark SQL，用于机器学习的 MLlib，用于图处理的 GraphX 和用于流计算的的 Spark Streaming。在这...
复制链接

扫一扫

专栏目录