Spark安装

最新推荐文章于 2023-03-26 19:43:31 发布

alice_wonderland_22

最新推荐文章于 2023-03-26 19:43:31 发布

阅读量593

点赞数 1

文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alice_wonderland_22/article/details/79300556

版权

之前一直用的hadoop，最近用到Spark觉得很惊艳。Spark 是一种与 Hadoop 相似的开源集群计算环境，但是Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

正如下图所示spark和Hadoop的关系，spark的分析大多依赖于Hadoop的分布式文件系统HDFS，Hadoop的Mapreduce与spark都可以进行数据计算，而相比于Mapreduce，spark的速度更快并且提供的功能更加丰富。

下面就开始安装Spark。spark的安装比较简单，只需要Java JDK、hadoop的支持。

我是安装在linux系统下，已装有Hadoop 2.7.3，Java JDK 1.7。

1.从官网下载

首先到官网下载一份打包好的spark，如果不使用HDFS，可以随便下载一个适配任何Hadoop的版本的Spark。

2.下载完毕之后使用xftp直接复制到/home/hadoop目录下并解压

sudo tar -zxf ~/spark-2.2.1-bin-hadoop2.7.tgz

这一步见仁见智，安装xftp后上载下载都很直观

3.解压完成后即可

4.试试在命令行输入：spark-shell

出现这样就恭喜你安装成功啦(●'◡'●)

sparksql和任务划分在学习中，之后要是有总结再整理吧~~

alice_wonderland_22

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Spark安装

之前一直用的hadoop，最近用到Spark觉得很惊艳。Spark 是一种与 Hadoop 相似的开源集群计算环境，但是Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。正如下图所示spark和Hadoop的关系，spark的分析大多依赖于Hadoop的分布式文件系统HDFS，Hadoop的Mapreduce与spark都可以进行数据计算，而相比于Mapredu...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。