spark简介（一）

最新推荐文章于 2024-07-31 13:16:03 发布

java大数据编程

最新推荐文章于 2024-07-31 13:16:03 发布

阅读量1.7k

点赞数

分类专栏： spark 文章标签： spark简介 spark特性 spark生态栈 spark简史

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cold_wolfie/article/details/82056546

版权

Spark是一个统一的大规模数据处理引擎，支持批处理、迭代计算、交互式查询和流处理。其特性包括快速性、简单易用和通用性，可在多种调度平台上运行。Spark生态包括Spark Core、Spark SQL、Spark Streaming、MLlib和GraphX，广泛应用于数据分析和数据处理。Spark自2009年起不断发展，至今已支持DataFrame API和Structured Streaming等新特性。

摘要由CSDN通过智能技术生成

spark是一个用于大规模数据处理的统一计算引擎。适用于各种各样原先需要多种不同的分布式平台处理的场景，包括批处理、迭代计算、交互式查询、流处理。通过统一的框架将各种处理流程整合到一起。

spark特性

快速性

spark通过使用先进的DAG调度器、查询优化器和物理执行引擎，可以高性能地进行批量及流式处理。使用逻辑回归算法进行迭代计算，spark比hadoop速度快100多倍。

快速性

简单易用

spark支持多种编程语言，比如Java、Scala、Python、R及SQL。

spark提供了超过80多个高级算子操作，可以很便捷地构建并行计算应用。

通用性

spark构建了一个完善的生态栈，将批量计算、交互式计算、流式计算、机器学习及图计算整合到一个统一的框架体系中。

通用性

处处运行

spark可以运行在standalone、YARN、Mesos、Kubernetes及EC2多种调度平台上。

另外，spark可以接入多种数据源，比如HDFS、Alluxio、HBase、Cassandra、Hive及本地文件。

处处运行

spark生态栈

spark生态栈

最低0.47元/天解锁文章

java大数据编程

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

java大数据编程 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。