spark的架构思考（一）

最新推荐文章于 2024-01-23 00:35:13 发布

freshghost1234

最新推荐文章于 2024-01-23 00:35:13 发布

阅读量327

点赞数

分类专栏：大数据-计算框架-spark 文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34969081/article/details/62429155

版权

大数据-计算框架-spark 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

任何架构都是由需求分析得来，而spark是由怎么样的需求分析而来的呢？

需求：怎样快速计算大数据
解决方案：将大量的数据分成很多块，让不同的计算机进行计算，然后再汇总起来，这就是简单的MR计算模型。
但是hadoop的MR计算模型，太单一，而且重度依赖IO，
新的需求：需求又来了，怎样又让它快，又让它计算模型复杂呢？

需求分析：
1. 非功能性需求：计算快
什么导致MR 计算模型慢呢：
在MapReduce任务内部，为了防止Reduce任务的失败，Map通常会把结果存储在磁盘上。
2. 功能需求：复杂的计算模型。
map stage 、 reduce stage
这个计算模型，如果需要复杂的怎么办呢，需要多个 MapReduce,形成一个DAG。这样不仅慢，而且很笨重。
（未完待续）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。