spark环境搭建

操作系统:Ubuntu18.4

一、前提:安装java-jdk1.7以上

我选的是1.8版本,好像1.7版本对之后的spark部分模块不适合,所以选了这个版本。

安装方式:在网上下载jdk1.8版本的压缩文件,然后在terminal窗口输入命令:tar -zxvf 压缩文件名。解压结束后,terminal路径进入解压文件下面的bin文件,输入:pwd,查看当前路径

添加路径:terminal返回根目录,打开bash_profile文件,输入:nano bash_profile,添加下端代码:

export JAVA_HOME=/home/zsc/app/jdk1.8.0_181
export PATH=$JAVA_HOME/bin:$PATH

关闭文件,输入:source bash_profile,保存修改路径。在terminal窗口输入命令:java -version,查看路径是否添加成功

二、安装spark

我选的版本是下面这个:

安装方法其实和上面jdk差不多。

首先下载压缩包,然后解压,terminal路径进入解压文件下面的bin文件,(虽然我对Python很熟悉,但是spark底层使用Scala语言实现的,以后如果要看里面源码,最终还是要懂Scala语法,所以我就选择安装Scala shell),输入:./spark-shell,就开始安装了,最后出现下面图样就说明成功啦!

为了验证spark能否正常使用,可以创建一个简单的hellospark.txt文件

hello spark
hello world
hello spark!

然后输入下面三行代码:

val file = spark.sparkContext.textFile("file:///home/zsc/data/hellospark.txt")
val wordcounts = file.flatMap(line =>line.split(" ")).map((word =>(word,1))).reduceByKey(_+_)
wordcounts.collect

//最后输出下面结果,就说明成功啦!
res0: Array[(String, Int)] = Array((spark!,1), (spark,1), (hello,3), (world,1))

还是像上面那样,添加路径到环境变量:terminal返回根目录,打开bash_profile文件,输入:nano bash_profile,添加下端代码:

export SPARK_HOME=/home/zsc/app/spark-2.4.0-bin-hadoop2.6
export PATH=$SPARK_HOME/bin:$PATH

关闭文件,输入:source bash_profile,保存修改路径。

为什么要添加路径到环境变量呢?不添加,每次都要到bin目录下运行,而添加后,可以在任意路径下运行

注意:如果想让添加的环境变量永久生效,不用每次开机都执行一遍:source bash_profile,可以在根目录下的文件 .bashrc加入下面这行代码:source /home/zsc/bash_profile,再执行:source .bashrc,永久环境变量就可以生效啦!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值