spark安装

最新推荐文章于 2024-05-07 16:08:49 发布

习惯de味道

最新推荐文章于 2024-05-07 16:08:49 发布

阅读量198

点赞数 2

分类专栏： spark 文章标签： spark安装单机模式

本文链接：https://blog.csdn.net/timicai/article/details/109384420

版权

spark 专栏收录该内容

23 篇文章 2 订阅

订阅专栏

spark安装

一、前提

安装jdk
版本号：
scala scala-2.11.12
spark spark-2.4.5
传送链接
提取码：w2xv

二、安装scala环境

上传scala安装包到opt目录下
解压：tar -zxvf scala-2.11.12.tgz
重命名：mv scala-2.11.12 scala
配置系统环境变量：

export SCALA_HOME=/opt/scala
export PATH=$SCALA_HOME/bin:$PATH

编辑完成后：source /etc/profile
验证安装：scala -version

三、spark安装

上传spark安装包到opt目录
解压：tar -zxvf spark-2.4.5-bin-hadoop2.6.tgz
重命名：mv spark-2.4.5-bin-hadoop2.6 spark
修改配置文件

cd spark/conf
cp spark.env.sh.template spark.env.sh
cp  slaves.template slaves
vi spark.env.sh

在最后一行增加如下内容：

export JAVA_HOME=/opt/jdk1.8.0_221
export SCALA_HOME=/opt/scala
export SPARK_HOME=/opt/spark
# 主机名或者IP地址
export SPARK_MASTER_IP=hadoop001
export SPARK_EXECUTOR_MEMORY=2G

配置系统环境变量

注：spark启动命令start-all.sh与hadoop启动命令冲突，所以不进行配置

export SPARK_HOME=/opt/spark
export PATRH=$SPARK_HOME/bin:$PATH

启动spark

6.1 本地模式启动

spark-shell
或
spark-shell --master local

可以通过以下几种方式设置spark运行的线程数
（1）local：所有计算都运行在一个线程中；
（2）local[K]：指定K个线程来运行计算，通常CPU有几个Core（线程数），就指定K为几，最大化利用CPU并行计算能力；
（3）local[*]：自动设定CPU的最大Core数；

在这里插入图片描述

6.2 standalone–单节点模式启动

spark-shell --master spark://hadoop001:7077

在这里插入图片描述

6.3 yarn模式启动
注:上述配置为单节点，不支持集群启动

spark-shell --master yarn-client

四、测试

//定义一个数组
sc.parallelize(List("hello world","hello java","hello scala","hello spark"))
//单词计数
res0.flatMap(_.split(" ")).map(x=>(x,1)).reduceByKey(_+_).collect.foreach(println)

在这里插入图片描述

习惯de味道

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark安装

一、前提安装jdk版本号：scala scala-2.11.12spark spark-2.4.5传送链接提取码：w2xv二、安装scala环境上传scala安装包到opt目录下解压：tar -zxvf scala-2.11.12.tgz重命名：mv scala-2.11.12 scala配置系统环境变量：export SCALA_HOME=/opt/scalaexport PATH=$SCALA_HOME/bin:$PATH编辑完成后：source /etc
复制链接

扫一扫

专栏目录