01: Spark的安装与配置

盈秋君

已于 2022-09-11 18:37:36 修改

阅读量1k

点赞数

分类专栏： spark笔记

于 2022-09-11 18:36:34 首次发布

本文链接：https://blog.csdn.net/lijun05/article/details/126806573

版权

Spark Linux 安装配置 HDFS

关键词由CSDN通过智能技术生成

spark笔记专栏收录该内容

10 篇文章 1 订阅

订阅专栏

首先，将安装包通过XFTP传到Linux主机的/home/hadoop/Downloads文件夹下，然后解压安装：

[hadoop@master Downloads]$ sudo tar -zxf spark-2.1.0-bin-without-hadoop.tgz -C /usr/local

[hadoop@master Downloads]$ cd  /usr/local

[hadoop@master local]$ sudo mv ./spark-2.1.0-bin-without-hadoop ./spark

修改hadoop用户对文件夹spark的访问权限：

[hadoop@master local]$ sudo chown -R hadoop:hadoop ./spark

配置
复制一份由Spark安装文件自带的配置文件模板：

[hadoop@master local]$ cd /usr/local/spark
[hadoop@master spark]$ cp ./conf/spark-env.sh.template ./conf/spark-env.sh
[hadoop@master spark]$ vim ./conf/spark-env.sh

使用vim编辑器打开spark-env.sh，再第一行添加配置信息：

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

验证Spark安装是否成功：

[hadoop@master spark]$ cd /usr/local/spark
[hadoop@master spark]$ bin/run-example SparkPi 2>&1 | grep "Pi is roughly"

返回结果：
Pi is roughly 3.1386556932784666
3. 启动HDFS后，Spark可以对HDFS中的数据进行读写。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

盈秋君

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Spark的安装与配置过程

欢迎来到小韩的CSDN~

06-13

1897

一、Spark 概述 1.了解 1、定义： Spark是一种基于内存的快速、通用、可扩展的大数据分析引擎。 2.诞生： 2009年诞生于加州大学伯克利分校AMPLab，项目采用Scala编写。 2010年开源; 2013年6月成为Apache孵化项目 2014年2月成为Apache顶级项目。 2.Spark 内置模块及特点 1.spark是基于内存计算的大数据并行计算框架，并且它适合各种各样的分布式平台系统。网上可以查看spark的生态环境。由生态环境也可以看出spark主要包含了Spark Core、S

Spark的安装与使用第2关：安装与配置Spark开发环境

qq_61604164的博客

12-16

2887

Spark的安装与使用第2关：安装与配置Spark开发环境

参与评论您还未登录，请先登录后发表或查看评论

spark安装配置

m0_66279156的博客

06-02

3857

spark安装配置

Spark的安装与配置

Li_and_Li的博客

05-18

562

Spark是一个开源集群运算框架，Spark在存储器内运行程序运算速度比Hadoop MapReduce的运算快100倍以上。

spark的安装和配置

qq_44079295的博客

08-30

1282

1、下载spark压缩包到linux进行解压 2、配置环境变量文件 #编辑配置文件 vim /etc/profile #添加下面两行 export SPARK_HOME=/software/spark export PATH=$PATH:$SPARK_HOME/bin export PATH=$PATH:$SPARK_HOME/sbin 3、配置主机信息 #进入conf目录中 cd /software/spark/conf #先从提供的模板中复制slaves和spark-env.sh文件 cp sl

Spark 安装与配置

weixin_64358432的博客

04-19

454

spark-env.sh.template 为 spark-env.sh。6.复制重命名 spark-env.sh 和 slaves。配置 Spark HA 集群需要配置zookeeper。slaves.template 为 slaves。9.启动 spark 集群，并用 jps 查看。并用 ll 查看是否有该文件。1.到该文件路径下。3.修改解压后spark 的目录名。5.到 spark/conf 目录下。7.配置 spark-env.sh。2.解压该安装包到某一目录下。一 . 下载Spark。

Spark实验：Standalone模式安装部署（带答案）1

08-03

4. Spark配置文件：如`spark-env.sh`、`slaves`，用于指定Spark集群的运行参数和从节点列表。 5. Spark Web UI的使用：提供可视化界面监控Spark集群状态和应用运行情况。 **四、实验步骤** 1. **解压Spark安装包**...

实验八、Spark的安装与使用.doc

07-08

Spark 安装与使用实验报告本实验报告的目的是学习大数据分析引擎 Spark 的安装与使用。Spark 是一个基于内存的分布式计算框架，能够高效地处理大规模数据。一、实验目的本实验的目的是学习 Spark 的安装与使用...

Spark实验：On Yarn模式安装部署（带答案）1

08-03

总结来说，Spark on Yarn的安装部署涉及到多个环节，包括环境配置、资源管理器的设置、集群启动以及应用的提交和监控。每个步骤都需要仔细操作，以确保Spark能够有效地在Hadoop集群上运行。通过这个实验，不仅可以...

实验七：Spark初级编程实践

07-15

本实验旨在通过实践操作，让学生熟悉 Spark 的基本使用，包括安装配置、数据读取、数据处理以及独立应用程序的开发。 1. **安装 Hadoop 和 Spark** 在实验环境中，首先需要安装 Hadoop 和 Spark。Hadoop 是一个...

【Spark】（一）Spark安装配置

weixin_42804692的博客

04-25

383

浏览器输入地址192.168.56.171:9999。到主节点spark的sbin下运行。spark实现World Count。Scala（不安装进程也可以启动）2.1 配置conf目录下的。2.3 配置sbin目录下的。在虚拟机里面使用spark。

Spark安装及配置详细步骤

qq_41126685的博客

05-03

1万+

1、解压scala、spark： tar -zxvf scala-2.11.8.tgz tar -zxvf spark-2.4.4-bin-hadoop2.6.tgz 2、配置环境变量(master、slave1、slave2分别执行)： export SCALA_HOME=/usr/local/src/scala-2.11.8 export SPARK_HOME=/usr/local/src/...

Spark安装配置【全网最全保姆级教程】

热门推荐

tangyi2008的专栏

02-24

5万+

Spark 是一个大规模数据处理的统一分析引擎本文主要介绍Spark的相关配置，以及各种模式的代码提交，包括Local,Standalone,YARN。文末有相应资源下载网盘链接。

大数据与云计算：Spark的安装与配置(保姆级教程！）

未来社会二十年发展的核心技术趋势由ABCD四个字母组成，分别是AI（人工智能）、BlockChain（区块链）、Cloud（云）、和Data（大数据）每一次进步都有新的认知和感触

09-24

2869

Apache Spark是一个基于内存的分布式计算框架，它提供了高效、强大的数据处理和分析能力。与传统的Hadoop MapReduce相比，Spark的主要优势在于其能够将数据集缓存在内存中，从而大大减少了磁盘I/O操作，提高了数据处理速度。Spark提供了多种编程接口，包括Scala、Java、Python和R等，同时还提供了交互式Shell，易于使用和快速调试。

Spark系列(一)spark简介及安装配置

qq_38130094的博客

07-13

6865

什么是Spark：Spark是一个用于大规模数据处理的统一计算引擎注意：Spark不仅仅可以做类似于MapReduce的离线数据计算，还可以做实时数据计算，并且它还可以实现类似于Hive的SQL计算，等等，所以说它是一个统一的计算引擎内存计算Spark中一个最重要的特性就是基于内存进行计算，从而让它的计算速度可以达到MapReduce的几十倍甚至上百倍2. spark特点：2.1 Speed：速度快由于Spark是基于内存进行计算的，所以它的计算性能理论上可以比MapReduce快100倍。

spark安装须知：SPARK_DIST_CLASSPATH配置

学亮编程手记

07-02

5048

请注意，Spark2.x是用Scala2.11预构建的，但2.4.2版本除外，它是用Scala2.12预构建的。Smark3.0+是用Scala2.12预构建的。 spark-env.sh中配置： export SPARK_DIST_CLASSPATH=$(/opt/bigdata/hadoop-2.9.2/bin/hadoop classpath) 有了SPARK_DIST_CLASSPATH配置信息以后，Spark就可以把数据存储到Hadoop分布式文件系统HDFS中，也可以从HDFS中读取数据。如

大数据随记 —— Spark 基本安装及相关配置

繁依Fanyi的博客

08-18

2584

输入 http://master:8080/，或者主节点ip:8080 进入Master 资源监控 Web UI 界面。② 修改 spark-env.sh 文件，添加 JAVA_HOME 环境变量和集群对应的 master 节点。一般选择好 Spark 版本后就会出现配置方法。进入 Spark 的 conf 目录。② 在 workers 中添加以下节点。① 拷贝 spark-env.sh。⑤ 配置 Spark 环境变量。③ 移动相关文件到指定目录。① 拷贝 workers。① 进入安装包所在目录。...

大数据分析新手指南：Spark安装与Python测试教程

4. 配置环境变量：为了让系统能够识别Spark，需要将Spark的安装目录添加到环境变量中。对于Windows系统，通常是添加到PATH变量中。对于Linux或Mac系统，可以通过修改.bashrc或.zshrc文件来设置环境变量。 5. 验证...