JobTracker内部原理—— 任务推测执行原理

啥是任务推测

分布式集群环境下, 一个作业的多个任务可能运行速度不一致,可能出现某个任务拖后腿,拖慢整个进度,为了避免这种情况,hadoop采用了推测执行机制(speculative execution) , 根据一定法则推测出拖后腿的任务,并为此任务启动一个备份任务,让该任务与原始任务同时处理同一份数据,并最终选用最先成功运行完成任务的计算结果作为最终结果。

任务推测的算法:
1.0.0版本和0.21.0版本都有对应的算法,但是在2.0版本后采用了和之前不一样的推测执行机制,它重点关注新启动的备份任务是否有潜力比当前正在运行的任务完成得更早,如果通过一定的算法推测某一时刻启动备份任务,该备份任务在运行的任务完成得晚,那只会浪费更多的资源。
假设某一时刻,任务T的执行进度为progress,则可通过一定的算法推测出该任务的最终完成时刻extimatedEndTime。另一方面,如果此刻为该任务启动一个备份任务,则可推断出它可能的完成时刻extimatedEndTime’ , 于是可以得到

estimatedEndTime = estimatedRunTime + taskStartTime

extimatedRunTime = (currentTimstamp - taskStartTime ) / progress

estimatedEndTime’ = currentTimestamp+averageRunTime

currentTimestamp为当前时刻,taskStartTime为任务启动时刻,
averageRunTime为已经成功运行完成的任务的平均时间。
YARN总是先择estimatedEndTime和estimatedEndTime’ 差值最大的任务,并为之启动备份任务,为了防止大量任务同时启动备份任务造成资源浪费,YARN会为每个作业设置同时启动的备份任务数目上限。

推测执行机制实际上采用了经典的空间换时间,同时启动多个相同任务处理相同的数据,并让这些任务竞争以缩短数据处理时间,在集群资源紧张的情况下,应合理使用该机制,争取在多用少量资源的情况下, 减少大作业的计算时间。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值