87-Spark推测执行spark.speculation

最新推荐文章于 2023-05-13 18:09:42 发布

九师兄

最新推荐文章于 2023-05-13 18:09:42 发布

阅读量5k

点赞数

分类专栏：大数据-spark 文章标签： spark 推测执行 spark.speculation

本文为博主九师兄（QQ:541711153 欢迎来探讨技术）原创文章，未经允许博主不允许转载。

本文链接：https://blog.csdn.net/qq_21383435/article/details/79749459

版权

大数据-spark 专栏收录该内容

204 篇文章 480 订阅 ¥49.90 ¥99.00

订阅专栏

本文介绍了Spark的推测执行机制，旨在优化慢速任务，提高作业计算速度。当某个Task运行显著慢于其他Task时，Spark会在其他Executor上启动相同Task的推测实例。若推测任务成功，则采用其结果并终止其他实例。然而，推测执行需谨慎使用，可能造成资源过度占用。源代码分析揭示了推测执行的检测和调度逻辑。

摘要由CSDN通过智能技术生成

在这里插入图片描述

1. 背景

hadoop的推测执行
　　推测执行(Speculative Execution)是指在分布式集群环境下，因为程序BUG，负载不均衡或者资源分布不均等原因，造成同一个job的多个task运行速度不一致，有的task运行速度明显慢于其他task（比如：一个job的某个task进度只有10%，而其他所有task已经运行完毕），则这些task拖慢了作业的整体执行进度，为了避免这种情况发生，Hadoop会为该task启动备份任务，让该speculative task与原始task同时处理一份数据，哪个先运行完，则将谁的结果作为最终结果。
　　推测执行优化机制采用了典型的以空间换时间的优化策略，它同时启动多个相同task（备份任务）处理相同的数据块，哪个完成的早，则采用哪个task的结果，这样可防止拖后腿Task任务出现，进而提高作业计算速度&#x

了解本专栏

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

九师兄 你的鼓励是我做大写作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。