分布式调度系统-任务调度

本文探讨了如何通过分布式任务调度处理海量数据,以MapReduce为例阐述其工作原理,并介绍了阿里飞天任务调度系统,包括App Master和App Worker的角色。文章还讨论了任务调度的关键技术,如数据Locality、数据Shuffle和Instance的错误处理策略。
摘要由CSDN通过智能技术生成

课程链接:阿里云大学_分布式系统开发-调度技术

海量数据如何并发处理?

这就是分布式任务调度所要解决的问题

举个栗子:

如何快速的做出大量的热狗?

在这里插入图片描述

如果将每一个一个热狗按流程做的话,可见工作量会十分巨大而且效率低下

MapReduce实例

Google的传奇大神Jeff Dean借鉴函数式编程的思想,提出了MapReduce解决方案,其核心思想其实很简单:

  1. 对任务按需求切分成多个子任务
  2. 对每一个子任务做mapping映射操作,得到一个中间态结果
  3. 再对所有的中间态结果进行reduce合并,得到最终结果

在这里插入图片描述

我们换个角度理解MapReduce操作:

  1. 做热狗时,会有多个厨师分别把不同的原材料切好,这一步叫mapping操作,至于切成什么样可不是随便的,这要由问题的解空间决定,比如要做热狗,就要把面包切两半,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值