前沿技术Spark，Flink，Beam

最新推荐文章于 2024-08-06 20:15:14 发布

慧有未来

最新推荐文章于 2024-08-06 20:15:14 发布

阅读量3.6k

点赞数

分类专栏：大数据文章标签： Spark Flink Beam

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35283816/article/details/79776628

版权

本文探讨了MapReduce的不足，如开发复杂、运行速度慢和框架多样性问题。接着介绍了Spark的优势，如速度快、易用、通用，并能在多种平台上运行。对比了Hadoop和Spark的特点，强调了它们的互补性。接着提到了Flink作为开源流处理框架的特性，以及分布式计算框架Beam在大数据处理中的重要角色。文章涵盖了这三大框架的关键特性和应用场景。

摘要由CSDN通过智能技术生成

MapReduce的缺点：

1.开发

wordcount程序复杂

只支持map和reduce方法

执行效率低下

以作业连方式串起来执行

打包

2.运行速度：

map输出写到磁盘，reduce写到hdfs，磁盘I/O，网络I/O，序列化等压力大

map任务和reduce任务以进程方式运行

一定要求排序（其实有时候不需要）

不适合迭代处理，交互式（数据挖掘）处理，流式处理

3.框架多样性：

维护和学习成本大

Spark特点：

速度快，使用方便，通用性，可以运行在hadoop,Hadoop, Mesos, Kubernetes, standalone, cloud

Hadoop生态系统和Spark生态系统：

BDAS：Berkeley Data Analytics Stack

Hadoop和Spark生态圈：

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。