在linux下spark环境搭建

本文档详细介绍了如何在Linux系统中搭建Spark环境,包括基础环境准备、下载安装文件、配置Spark及其环境变量,以及验证安装成功。特别强调了在没有Hadoop的情况下,Spark仅能访问本地文件系统,而配置相关文件后,Spark可读取Hadoop的HDFS数据。最后,文章提到了如何在Spark Shell中运行代码进行验证。
摘要由CSDN通过智能技术生成

安装Spark

1 基础环境

Spark支持4种不同类型的部署方式,包括:
Local模式:单机模式
Standalone模式:使用Spark自带的简单集群管理器
YARN模式:使用YARN作为集群管理器
Mesos模式:使用Mesos作为集群管理器

Spark可以独立安装使用,也可以和Hadoop一起安装使用。安装了Hadoop后,就可以让Spark使用HDFS存取数据。,不安装Hadoop,Spark只能访问本地文件系统数据。需要说明的是,当安装好Spark以后,里面就自带了scala环境,不需要额外安装scala。

本实验采用Spark访问本地文件系统数据。安装Spark之前需要安装Linux系统、Java环境。经过上面的步骤以后,就在单台机器上按照“Spark(Local模式)”这种方式完成了Spark环境的搭建。

2 下载安装文件

Spark安装包下载地址: http://spark.apache.org.
进入下载页面后,点击主页右侧的“Download Spark”按钮进入下载页面,下载页面中提供了几个下载选项,主要是Spark release及Package type的选择,如下图所示。第1项Spark release一般默认选择最新的发行版本,截至2018年4月份的最新版本为2.3.0(本教程采用2.1.0)。第2项package type则选择“Pre-build with user-prov

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值