云计算异构集群系统存在的问题

最新推荐文章于 2023-05-22 12:37:12 发布

house.zhang

最新推荐文章于 2023-05-22 12:37:12 发布

阅读量1.9k

点赞数

分类专栏：云计算文章标签：集群云计算任务 hadoop 任务调度算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pop_xiaohao/article/details/7310226

版权

云计算专栏收录该内容

6 篇文章 0 订阅

订阅专栏

异构集群系统存在的问题

现有的Hadoop调度器都是建立在同构集群的假设前提下，具体假设如下：

1）集群中各个节点的性能完全一样

2）对于reduce task，它的三个阶段：copy、sort和reduce，用时各占1/3

3）同一job的同类型的task是一批一批完成的，他们用时基本一样

实际当中却不然，集群系统需要面对：

1）处理机具有不同计算速度

2）通信能力和存储容量

3）数据局部性问题

如何调和不同处理机计算速度，不同机器之间数据传输问题以及因数据聚集带来I/O传输和网络消耗问题，都是在构架异构集群需要考虑的问题。总之把复杂应用的所有任务合理地调度分配到异构计算系统的各个处理机上, 并追求整个应用的最小完成时间的任务调度问题, 是异构集群计算系统提高性能的一个非常关键的问题。

其中这些问题可以统一理解为，hadoop集群在运行时分配到不同节点上相同计算任务在运行过程当中在开始时间、处理速度、等上存在不一致的情况下，照成有的节点计算起来一下子计算完了，有些任务需要等待很长的时间。总之就是各个节点任务结束不一致，这就要求我们采取方法让任务执行完成基本一致，这就需要我们侦探落后任务。

解决方法：现有的Hadoop调度器存在较大缺陷，主要体现在探测落后任务的算法上：如果一个task的进度落后于同类型task进度的20%，则把该task当做落后任务(这种任务决定了job的完成时间，需尽量缩短它的执行时间)，从而为它启动一个备份任务（speculativetask）。如果集群异构的，对于同一个task，即使是在相同节点上的执行时间也会有较大差别，因而在异构集群中很容易产生大量的备份任务。减少过多的备份任务也是需要我们考虑的问题。基于现在情况下存在的问题解决方法可以参考Late调度算法这里就不做深入分析。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

house.zhang 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。