云计算异构集群系统存在的问题

异构集群系统存在的问题

               

现有的Hadoop调度器都是建立在同构集群的假设前提下,具体假设如下:

1)集群中各个节点的性能完全一样

2)对于reduce task,它的三个阶段:copy、sort和reduce,用时各占1/3

3)同一job的同类型的task是一批一批完成的,他们用时基本一样

实际当中却不然,集群系统需要面对:

1)处理机具有不同计算速度

2)通信能力和存储容量

3)数据局部性问题

如何调和不同处理机计算速度,不同机器之间数据传输问题以及因数据聚集带来I/O传输和网络消耗问题,都是在构架异构集群需要考虑的问题。总之把复杂应用的所有任务合理地调度分配到异构计算系统的各个处理机上, 并追求整个应用的最小完成时间的任务调度问题, 是异构集群计算系统提高性能的一个非常关键的问题。

其中这些问题可以统一理解为,hadoop集群在运行时分配到不同节点上相同计算任务在运行过程当中在开始时间、处理速度、等上存在不一致的情况下,照成有的节点计算起来一下子计算完了,有些任务需要等待很长的时间。总之就是各个节点任务结束不一致,这就要求我们采取方法让任务执行完成基本一致,这就需要我们侦探落后任务。

 

解决方法:现有的Hadoop调度器存在较大缺陷,主要体现在探测落后任务的算法上:如果一个task的进度落后于同类型task进度的20%,则把该task当做落后任务(这种任务决定了job的完成时间,需尽量缩短它的执行时间),从而为它启动一个备份任务(speculativetask)。如果集群异构的,对于同一个task,即使是在相同节点上的执行时间也会有较大差别,因而在异构集群中很容易产生大量的备份任务。减少过多的备份任务也是需要我们考虑的问题。基于现在情况下存在的问题解决方法可以参考Late调度算法这里就不做深入分析。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

house.zhang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值