JobTracker内部原理—— 任务推测执行原理

阿松0311

于 2021-12-01 19:35:02 发布

阅读量185

点赞数

分类专栏： Hadoop技术内幕文章标签：大数据 hadoop mapreduce

本文链接：https://blog.csdn.net/weixin_44773984/article/details/121661316

版权

Hadoop技术内幕专栏收录该内容

24 篇文章 1 订阅

订阅专栏

啥是任务推测

分布式集群环境下，一个作业的多个任务可能运行速度不一致，可能出现某个任务拖后腿，拖慢整个进度，为了避免这种情况，hadoop采用了推测执行机制(speculative execution) , 根据一定法则推测出拖后腿的任务，并为此任务启动一个备份任务，让该任务与原始任务同时处理同一份数据，并最终选用最先成功运行完成任务的计算结果作为最终结果。

任务推测的算法：
1.0.0版本和0.21.0版本都有对应的算法，但是在2.0版本后采用了和之前不一样的推测执行机制，它重点关注新启动的备份任务是否有潜力比当前正在运行的任务完成得更早，如果通过一定的算法推测某一时刻启动备份任务，该备份任务在运行的任务完成得晚，那只会浪费更多的资源。
假设某一时刻，任务T的执行进度为progress，则可通过一定的算法推测出该任务的最终完成时刻extimatedEndTime。另一方面，如果此刻为该任务启动一个备份任务，则可推断出它可能的完成时刻extimatedEndTime’ , 于是可以得到

estimatedEndTime = estimatedRunTime + taskStartTime

extimatedRunTime = (currentTimstamp - taskStartTime ) / progress

estimatedEndTime’ = currentTimestamp+averageRunTime

currentTimestamp为当前时刻，taskStartTime为任务启动时刻，
averageRunTime为已经成功运行完成的任务的平均时间。
YARN总是先择estimatedEndTime和estimatedEndTime’ 差值最大的任务，并为之启动备份任务，为了防止大量任务同时启动备份任务造成资源浪费，YARN会为每个作业设置同时启动的备份任务数目上限。

推测执行机制实际上采用了经典的空间换时间，同时启动多个相同任务处理相同的数据，并让这些任务竞争以缩短数据处理时间，在集群资源紧张的情况下，应合理使用该机制，争取在多用少量资源的情况下，减少大作业的计算时间。

阿松0311

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
JobTracker内部原理—— 任务推测执行原理

啥是任务推测分布式集群环境下，一个作业的多个任务可能运行速度不一致，可能出现某个任务拖后腿，拖慢整个进度，为了避免这种情况，hadoop采用了推测执行机制(speculative execution) , 根据一定法则推测出拖后腿的任务，并为此任务启动一个备份任务，让该任务与原始任务同时处理同一份数据，并最终选用最先成功运行完成任务的计算结果作为最终结果。任务推测的算法：1.0.0版本和0.21.0版本都有对应的算法，但是在2.0版本后采用了和之前不一样的推测执行机制，它重点关注新启动的备份任务
复制链接

扫一扫