01_Spark

最新推荐文章于 2022-05-15 17:01:07 发布

坐在6号工位打螺丝

最新推荐文章于 2022-05-15 17:01:07 发布

阅读量72

点赞数

分类专栏： Scala 文章标签： spark scala big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44429965/article/details/120138480

版权

Scala 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

01_Spark

什么是spark
- spark是一个实现快速通用的集群计算平台
spark组成
下载Spark
环境准备
- 安装（略，建议百度）

什么是spark

spark是一个实现快速通用的集群计算平台

spark组成

SparkCore：将分布式数据抽象为弹性分布式数据集（RDD），为运行在其上的上层组件提供API。
SparkSQL：可以让我使用SQL语句的方式来查询数据
SparkStreaming：是Spark提供的实时数据进行流式计算的组件。
MLlib：提供常用机器学习算法的实现库。
GraphX：提供一个分布式图计算框架，能高效进行图计算。
BlinkDB：用于在海量数据上进行交互式SQL的近似查询引擎。
Tachyon：以内存为中心高容错的的分布式文件系统。

下载Spark

spark官网：http://spark.apache.org/downloads.html
清华镜像：https://mirrors.tuna.tsinghua.edu.cn/apache/

环境准备

Java8安装成功
zookeeper安装成功
hadoop2.7.5 HA安装成功
Scala安装成功（不安装进程也可以启动

安装（略，建议百度）

坐在6号工位打螺丝

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
01_Spark

01_Spark什么是sparkspark是一个实现快速通用的集群计算平台spark组成下载Spark环境准备安装（略，建议百度）什么是sparkspark是一个实现快速通用的集群计算平台spark组成SparkCore：将分布式数据抽象为弹性分布式数据集（RDD），为运行在其上的上层组件提供API。SparkSQL：可以让我使用SQL语句的方式来查询数据SparkStreaming：是Spark提供的实时数据进行流式计算的组件。MLlib：提供常用机器学习算法的实现库。GraphX：提
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。