Spark的安装与配置过程

一、Spark 概述

1.了解

1、定义:
Spark是一种基于内存的快速、通用、可扩展的大数据分析引擎。
2.诞生:
2009年诞生于加州大学伯克利分校AMPLab,项目采用Scala编写。
2010年开源;
2013年6月成为Apache孵化项目
2014年2月成为Apache顶级项目。

2.Spark 内置模块及特点

1.spark是基于内存计算的大数据并行计算框架,并且它适合各种各样的分布式平台系统。网上可以查看spark的生态环境。

由生态环境也可以看出spark主要包含了Spark Core、Spark SQL、Spark Streaming、Spark MLlib、集群管理器等框架,具体框架我不介绍了,网上可以查看。
2.spark的特点,为什么有了Hadoop生态了还需要spark吗?答案是肯定的,因为他有如下特点:

速度快:
spark是基于内存运算的,所以他运算效率要比Hadoop快100倍以上,什么概念???基于硬盘也要快上10倍以上,所以???
易用性:
spark支持scala、python、java、R。为此我专门学了scala语言。
通用性:
Spark可以用于批处理、交互式查询(SparkSQL)实时流处理(Spark Streaming)、机器学习(Spark MLlib)和图计算(GraphX)。
兼容性:
Spark可以非常方便地与其他的开源产品进行融合。比如,Spark可以使用Hadoop的YARN和Apache Mesos作为它的资源管理和调度器,并且可以处理所有Hadoop支持的数据,包括HDFS、HBase等。

二、spark的安装

1.环境配置

安装spark前必须先将Hadoop环境配置完成,可以参考下我的:
1.使用的Ubuntu系统
2.Hadoop:2.7.6版本
3.jdk:1.8版本
4.spark:2.00版本
注意:
提示:Hadoop2.7.?与spark2.3.?是匹配的。
版本一定要对应,反正很多软件之间都有版本对应,当然你吃点苦也好,以后就能记住了。

2.解压及安装

1.spark 有三种模式,自行上网查看。
2.下载spark的安装包:

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
安装和配置Spark SQL需要以下步骤: 1. 下载Spark:首先需要下载Spark的安装包。 2. 配置环境变量:将Spark的安装路径添加到系统的环境变量中,以便可以在任何位置使用Spark。 3. 配置spark-env.sh:在Spark的安装目录中,找到spark-env.sh文件并进行配置。这个文件包含了一些Spark的运行参数和环境变量的设置。 4. 配置works:在Spark的安装目录中,找到works文件并进行配置。这个文件用于配置Spark的集群管理器。 5. 配置历史服务器:如果需要使用Spark的历史服务器功能,可以进行相关配置。 6. Spark整合Hive的MetaStore:如果需要将Spark与Hive整合使用,需要配置Spark与Hive的元数据仓库。 7. 启动Spark:根据需要选择启动Spark的方式,可以是在本地环境下启动,也可以是在Standalone模式下启动。 8. 查看Spark Web接口位置:Spark提供了Web接口用于监控和管理Spark应用程序,可以查看Spark Web接口的位置。 需要注意的是,Spark在运行过程中可能需要读取Hive和HDFS的配置信息,所以需要将hive-site.xml、core-site.xml和hdfs-site.xml文件拷贝到Spark的conf目录下,以便Spark可以正确读取相关配置信息。\[2\]\[3\] #### 引用[.reference_title] - *1* *2* [Spark SQL配置记录总结-20230410](https://blog.csdn.net/u010503464/article/details/130061457)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Spark Sql 安装](https://blog.csdn.net/weixin_33881753/article/details/92443668)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值