1.spark学习(本地模式安装)

1.spark环境搭建

1.1准备工作

1.JDK(linux安装)
2.ScalaSDK 本机安装wins上安装
3.Spark安装包
spark官网下载地址(官网下载地址)
传送门:阿里云下载
这是我下载好的spark-3.0.0-preview2-bin-hadoop2.7.tgz

1.2原理

在这里插入图片描述

1.3操作

1.把文件上传到到服务器上spark-3.0.0-preview2-bin-hadoop2.7.tgb
2.解压tar -zxvf spark-3.0.0-preview2-bin-hadoop2.7.tgb
在这里插入图片描述
2.更改权限,如果你不是用的root上传的 需要更改权限

chown -R root /opt/spark-3.0.0-preview2-bin-hadoop2.7
-3.0.0-preview2-bin-hadoop2.7

看下这里权限显示root
在这里插入图片描述
名字太长了把名字改成spark
这些是目录下面的一些详解
在这里插入图片描述

1.4 测试

1.启动spark
/spark/bin/spark-shell
在这里插入图片描述
这个是没有java 环境配置jdk
安装jdk

yum -y list java*
yum install -y java-1.8.0-openjdk-devel.x86_64
java -version

然后继续运行

/spark/bin/spark-shell

在这里插入图片描述
2.访问里面的那个4040端口的那个

http://192.168.10.51:4040
如果发现访问不到可能是防火墙开着的我们把防火墙给关掉

启动防火墙
systemctl start firewalld
关闭防火墙
systemctl stop firewalld
查看防火墙状态
systemctl status firewalld

在这里插入图片描述
部署完成
3.执行运行案例去官网里面拿一个案例,把路径换掉
https://spark.apache.org/examples.html
在这里插入图片描述

val textFile = sc.textFile("file:///root/words.txt")
val counts = textFile.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _)
counts.collect

在这里插入图片描述

回到我们刚刚那个网站刷新可以看到任务的流程图
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MM-BD

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值