Spark的安装和部署

最新推荐文章于 2024-08-07 22:17:24 发布

半坡人

最新推荐文章于 2024-08-07 22:17:24 发布

阅读量991

点赞数 1

分类专栏：大数据 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sy755754582/article/details/90248807

版权

大数据同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

文章目录

1.概述

spark官网：http://spark.apache.org
spark是一个围绕速度，易用性和复杂分析架构的大数据处理框架；
他有如下优势：

运行速度快。spark是基于内存的，是hadoop的是100倍；
易用性。可以使用java,scala,python或者其他语言来写；
mapReduce,还支持sql查询，流数据,机器学习和图计算；
spark不仅仅可以处理hdfs上的数据，还可以处理其他数据。

2.安装

首先需要scala和spark的两个压缩包：
链接：https://pan.baidu.com/s/1GOA16GtKa6U9mUZR7k9uBw
提取码：8l3o
然后打开远程连接（事先搭建好的集群服务器）：

找到scala压缩包所在目录，解压
tar -zxvf scala-2.10.5.tgz

找到spark压缩包所在目录，解压
tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz

3.配置系统变量

编辑系统配置文件
vi /etc/profile

生效
source /etc/profile

4.进入spark shell

spark-shell

至此，就可以运行scala函数了，spark配置成功！

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。