Spark(一)Spark介绍

本文介绍了Spark的介绍、组成及优缺点。Spark作为一种统一的分析引擎,以其高速性能、通用性和易用性在大数据处理领域受到青睐。它支持多种编程语言和数据源,可用于批处理、流处理和机器学习。尽管Spark内存消耗较大,学习曲线较陡,但在特定场景下,其速度远超MapReduce,但并不能完全替代。
摘要由CSDN通过智能技术生成

一、Spark的介绍

发展前景:

1、目前许多领域的应用数据爆炸式增长,与前所未有的数据收集规模;例如:电子商务、社交网络、计算机生物、自媒体、公安交通、运营商等等。
2、大规模数据处理和分析系统越来越流行和重要。具备良好特性如通用性、容错性、高性能的大数据处理引擎是当前最受欢迎的。
3、较成熟的大数据计算框架MapReduce、Storm、Flink等都已近存在,与之相比Spark是更加通用的、快速的、性能较优秀的大数据处理系统。

官网介绍:

http://spark.apache.org
1、Spark 是一种用于处理大量级别的数据的统一的分析引擎
在这里插入图片描述
2、Spark使用了DGA调度程序、查询优化程序和物理执行引擎,为批处理和流处理数据实现了高性能;官方图中 spark的计算速度是mr的100倍。
3、Spark 优于 mapreduce 的计算速度,官方对比:
在这里插入图片描述
4、Spark提供了80多个高级运算符,并且支持 java、scala、Python,R,SQl 等的API ,能简单快速的使用spark构建并发程序。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值