Spark大白话(●—●)

Jodie大白话

已于 2022-08-01 12:58:08 修改

阅读量353

点赞数

分类专栏：大数据文章标签：大数据 spark hadoop mapreduce hdfs

于 2022-08-01 12:37:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41847894/article/details/126097612

版权

大数据专栏收录该内容

14 篇文章 0 订阅

订阅专栏

目录

🧡Spark vs Hadoop

🧡Spark on Yarn vs Spark on K8S

💟这里是CS大白话专场，让枯燥的学习变得有趣！

💟没有对象不要怕，我们new一个出来，每天对ta说不尽情话！

💟好记性不如烂键盘，自己总结不如收藏别人！

🧡Spark vs Hadoop

💌Spark的出现并非会替代Hadoop，而是对Hadoop的补充。

💌Spark是基于内存的计算框架，最大的优点就是速度快，但是随之带来的缺陷就是数据断电即失，因此还需要Hadoop中的HDFS来帮忙存储分布式数据。

💌Spark在数据处理上的优势也非常明显，包括四大组件：Spark Mlib（数据挖掘）、Spark Sql（数据查询）、Spark Streaming（实时流式处理）和Spark GraphX（图计算），相比Hadoop的MapReduce来说功能更强大。

💌但是Spark也不能完全替代MapReduce！正是因为Spark将中间数据存在内存中，如果数据较多、内存块较大，则非常占用内存资源甚至内存溢出，当与其他资源需求型服务一同运行时就是灾难，这种情况下，还是MapReduce更为合适。

🧡Spark on Yarn vs Spark on K8S

💌现在很多大厂都把服务部署到K8S云平台上运行了，Spark作为大数据计算框架也可以由K8S来编排调度，那么和on Yarn有什么区别呢？

🍠Yarn是做资源调度的，而K8S在资源调度的基础上，还可以对整个容器进行调度，也就是调度服务应用。

🍠Yarn是离线管理，K8S在线离线管理都可以。

🍠K8S不仅可以运行Spark，所有容器化的服务都可以部署其中。

🍠K8S有更好的隔离性。

🍠K8s缺少任务队列、动态资源分配和external shuffle service 等特性，需要进行优化，如：

京东Spark自研Remote Shuffle Service在大促中的应用实践http://t.csdn.cn/Hm5BG

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Jodie大白话 CSDN认证博客专家 CSDN认证企业博客

码龄7年

84: 原创

1万+: 周排名

54万+: 总排名

13万+: 访问

: 等级

1041: 积分

6683: 粉丝

111: 获赞

56: 评论

452: 收藏

私信

关注

热门文章

分类专栏

Java 22篇
算法 15篇
软件安装及问题解决 13篇
大数据 14篇
云计算 20篇
机器学习 1篇

最新评论

Jetson系列TensorRT .onnx转.trt/.engine
星辰韦: AttributeError: 'tensorrt.tensorrt.Builder' object has no attribute 'max_workspace_size'
Jetson系列安装onnxruntime-gpu
猫的空想: >>> import onnxruntime >>> onnxruntime.get_device() 'CPU' >>> onnxruntime.get_device() 'CPU' >>> onnxrumtime.get_available_providers() Traceback (most recent call last): File "<stdin>", line 1, in <module> NameError: name 'onnxrumtime' is not defined >>> onnxruntime.get_available_providers() ['AzureExecutionProvider', 'CPUExecutionProvider']为什么安装成功之后显示的还是CPU的呢
2022最新CKA认证指南看这里
Fatting！: 博主，黑五价会持续多长时间啊
23种Java设计模式
天蓝999: 可以的，我看的另一个神仙级Java设计模式实战，它结合SpringBoot，我彻底学会了Java设计模式及应用，见：https://blog.csdn.net/feiying0canglang/article/details/131900171
MySQL 服务无法启动如何解决
R. W: 找了好多方法，终于成功了，谢谢大佬

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。