Spark on Kubernetes 与 Spark on Yarn 不完全对比分析

最新推荐文章于 2024-02-29 18:26:14 发布

十一技术斩

最新推荐文章于 2024-02-29 18:26:14 发布

阅读量319

点赞数

文章标签： spark big data 大数据微服务 sqlserver

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uuqaz/article/details/123530235

版权

前言

Apache Spark 是目前应用最广泛的大数据分析计算工具之一。它擅长于批处理和实时流处理，并支持机器学习、人工智能、自然语言处理和数据分析应用。随着 Spark 越来越受欢迎，使用量越来越大，狭义上的 Hadoop (MR) 技术栈正在收缩。另外，普遍的观点和实践经验证明，除了大数据相关的工作负载，Hadoop (YARN) 不具备相应的灵活性去跟更广泛的企业技术栈融合与集成。比如去承载一些在线业务，而这正是 Kubernetes（K8s) 所擅长的领域。事实上，Kubernetes 的出现为 Spark 的改进打开了一个新世界的大门，创造了更多机遇。如果能用统一的一套集群去运行所有在线和离线的作业，也是十分吸引人的事情。

Spark on Kubernetes 于 Spark 2.3 [1] 版本引入开始，到 Spark 3.1 [2] 社区标记 GA，基本上已经具备了在生产环境大规模使用的条件。

在业内，苹果[3], 微软[4], 谷歌，网易，华为、滴滴，京东等公司都已经有内部大规模落地或者对外服务的经典成功案例。

Spark on Kubernetes 应用架构

从 Spark 整体计算框架层面来看，只是在资源管理层面多支持了一种调度器，其他接口都可以完全复用。一方面 Kubernetes 的引入和 Spark Standalone、YARN、 Mesos 及 Local 等组件形成了一个更为丰富的资源管理体系。

另一方面，Spark 社区在支持 Kubernetes 特性的同时，

最低0.47元/天解锁文章

十一技术斩

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

十一技术斩 CSDN认证博客专家 CSDN认证企业博客

码龄3年

487: 原创

3万+: 周排名

62万+: 总排名

118万+: 访问

: 等级

1万+: 积分

4520: 粉丝

3996: 获赞

396: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

记录一次mysql update导致锁表问题
这Leslie_Lau: 逆天，我写的原文直接被你转载了，还开vip 原文在这里，各位也可以看文章的创建时间：https://here-leslie-lau.github.io/post/mysql/update_lock_table/
Java面试题大全、题+详细解答（2022版）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272
RocketMQ保姆级教程
JavaMastergjh: 你好，请问为什么配了一个brokerIp1还要配一个brokerIp2呢
Java高级面试题整理（附答案）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272
40道JAVA经典算法面试题（答案）
飞羽疾驰: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。