Spark学习（一）Spark及其生态圈简介

最新推荐文章于 2023-12-12 10:10:38 发布

匿名啊啊啊

最新推荐文章于 2023-12-12 10:10:38 发布

阅读量797

点赞数

分类专栏： Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41851454/article/details/80007286

版权

1、什么是Spark

Apache Spark™是用于大规模数据处理的统一分析引擎。

Spark的通用性：

2、Spark的四大特性

（1）Speed：高效性

运行速度快

Spark拥有DAG执行引擎，支持在内存中对数据进行迭代计算。官方提供的数据表明，如果数据由磁盘读取，速度是Hadoop MapReduce的10倍以上，如果数据从内存中读取，速度可以高达100多倍。

（2）Ease of Use：易用性

易用性好

Spark不仅支持Scala编写应用程序，而且支持Java和Python等语言进行编写，特别是Scala是一种高效、可拓展的语言，能够用简洁的代码处理较为复杂的处理工作。

（3）Generality：通用性

通用性强

Spark生态圈即BDAS（伯克利数据分析栈）包含了Spark Core、Spark SQL、Spark Streaming、MLLib和GraphX等组件，这些组件分别处理Spark Core提供内存计算框架、SparkStreaming的实时处理应用、Spark SQL的即席查询、MLlib或MLbase的机器学习和GraphX的图处理，它们都是由AMP实验室提供，能够无缝的集成并提供一站式解决平台。

（4）Run Everywhere：随处运行

随处运行

Spark具有很强的适应性，能够读取HDFS、Cassandra、HBase、S3和Techyon为持久层读写原

最低0.47元/天解锁文章

匿名啊啊啊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark学习（一）Spark及其生态圈简介

1、什么是SparkApache Spark™是用于大规模数据处理的统一分析引擎。Spark的通用性：2、Spark的四大特性（1）Speed：高效性运行速度快 Spark拥有DAG执行引擎，支持在内存中对数据进行迭代计算。官方提供的数据表明，如果数据由磁盘读取，速度是Hadoop MapReduce的10倍以上，如果数据从内存中读取，速度可以高达100多倍。（2）Ease of Use：易用性...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。