VMware vSphere 5.1 群集深入解析（十四）-DRS计算推荐

如果使用1GB的网络vMotion过程中将需要预留30%的CPU，如果使用10GB网络的vMotion端口组，将需要预留100%的CPU，此预留在本地主机的资源池中设置，在源主机和目的主机上创建，如果多个vMotion正在运行，在vMotion任务之间预留资源被分享，在vMotion过程中目的主机上一个影子虚拟机将被创建，影子虚拟机的内存消耗也是成本需要考虑的因素之一。

益处

通过移动虚拟机，源主机上的资源被释放，这些资源可以为其它虚拟机提供使用，由于新的主机上低标准的配额，迁移过去的虚拟机也同样受益，DRS定义迁移的工作负载导致群集负载更加平衡。

如果在特定的资源上任何主机被使用过量，DRS将对所有的迁移资源给出高权重，例如，如果CPU发生资源争用，DRS将使用一个更高权重的CPU来解决争用，DRS在每次调用期间重新检查特定资源的过量情况。

风险

风险账户为可能的不规则负载建立，不规则负载表示不一致的高需求的负载

结合成本效益风险

DRS为重新平衡提供迁移建议，如果他们的估计成本低于他们的当前潜在的收益，最近的VM需求和主机的相对失衡，DRS结合成本效益和风险来计算虚拟机新的位置，以满足所有的约束和改善负载平衡。

成本效益和风险分析确定了资源迁移收益，无论是正面还是负面的，要确定迁移是否有一个正面积极的结果，虚拟机最后5分钟的工作负载特征被分析，这被称为“稳定”时间，并表示虚拟机已经使用资源多次时间，类似活动工作负载值，保守的估计是调用期间的剩余时间）调用周期持续时间-稳定时间），DRS假定虚拟机在最坏的负载下运行，从最后60分钟使用的最高值。

DRS包括迁移成本，并考虑源主机和目的主机的资源收益，如果成本收益和风险分析产生了积极的结果，DRS将只会建议迁移。

你可以想象，什么影响调整下，调用间隔将会有这样的分析，因为每个周期净资源收益被计算，通过周期长度增加权重，我们不建议改变这个区间，除非你完全了解这种变化的影响。

MinGoodness

除了成本效益分析，DRS将计算每一个动作的goodness值，此值表示群集在负载平衡移动时是正面或负面的影响，对于这两种成本效益和Goodness值，DRS使用相同的评级系统。

表 19：评级系统

每个移动获得Goodness评级，关系到当前的负载平衡和最小迁移阈值，如果移动将会伤害负载平衡，移动将会收到-2的评级，一个移动稍微降低负载平衡会得到-1的评级，一个提供负载平衡，但是提高不能满足最小阈值会收到Neutral评级，一个移动稍微提高（0.1）了负载平衡会得到+1评级，显著改善负载平衡的获得+2评级。

正如之前提到的，受益于移动DRS使用相同的值进行成本加权，这些评级应用如下：减少10%可用资源的移动得到-2评级，稍微减少可用资源的移动得到-1评级，如果对资源来说移动是是中性，不会帮助也不会伤害资源，将得到0评级，如果提高了可用资源的移动得到+1评级，当增加10%的可用资源的移动得到+2评级。

在提出建议之前，Goodness评级被用来对比成本收益评级，由于成本收益计算比Goodness计算更保守，这就是非常难看到DRS提出中性评级移动和低Goodness移动的建议，因此，DRS通常给出的建议是正面的成本收益移动和Goodness评级移动

当群集严重失衡，通过Goodness（MinGoodnessFiltering）和成本收益（CostBenefitFiltering）过滤移动能阻止DRS给出的移动建议，当任何主机的负载同目标主机的负载偏差0.2时，群集被视为严重失衡，如果你发现DRS在你的环境中不建议任何负载平衡移动，这可能是每个移动对群集不平衡影响太小，这可能是没有移动能明显提高群集平衡（MinGoodnessFiltering控制），或者改善群集失衡的成本太高（CostBenefitFilter控制）

为解决这种情形，vSphere 5.1在DRS负载均衡算法上配备了三个额外的步骤，这些步骤是

RelaxMinGoodness, RelaxCostBenfitFiltering and DropCostBenefitFiltering，它们是怎样工作呢？

表20：DRS调用步骤

在正常操作期间，中性移动或者负面的Goodness评级将会被拒绝；但是，如果群集严重失衡，它们可以被重新考虑和接受。如果在DRS负载平衡步骤后群集仍然严重失衡，如果负载平衡操作并不被迁移限制(MaxMovesPerHost)所限制，负载平衡将重新运行激活（RelaxMinGoodness（RMG））标志，这意味着，DRS认为之前移动中性Goodness和成本收益评级，将通过MinGoodNessFiltering放弃。

如果分析显示群集仍然严重失衡，即使在考虑移动之后，改善群集平衡作用比较小-但仍然是正面的方法，DRS设置RelaxCostBenefitFiltering(RCB)标志，改善负载平衡作用，由小到中的移动将被考虑，尽管它们在成本收益值方面有一点负面，如果这些额外移动不能够解决严重的失衡，那么DRS设置DropCostBenefit（DCB）标志，会认为在正常的负载平衡运行期间这些移动将被强烈拒绝。

相对于vSphere 5.1之前的版本，这项新功能可能会导致DRS产生更多的移动，但是请注意这些额外的移动将只出现在群集严重失衡的状态下。从本质上来讲，这个功能时一个自动化的方式来实现手动设置minGoodness=0和costBenefit=0的操作，但是,DRS适用这种机制只在绝对必要的状态时，手工开启可能会伤害虚拟机的性能。

计算迁移建议的优先级

迁移阈值指定了当前主机负载标准偏差（CHLSD）与目标主机负载标准偏差（THLSD）的平衡容忍度，迁移阈值因素配置是在群集级别通过DRS设置的，为了使迁移阈值设置更容易理解，引入优先级来体现在生成迁移建议时使用哪个容忍程度。

在计算中，DRS给每一个建议分配一个优先级，这个优先级对应迁移阈值，如果优先级少于或者等于迁移阈值，建议将被显示和应用，根据群集自动化水平，如果优先级在迁移阈值以上，建议要么不显示要么丢弃，你能想象迁移阈值作为DRS生成建议的过滤器。

级别1（保守）

当选择保守迁移阈值级别，唯一强调移动，优先推荐被执行，这意味着DRS群集不会调用任何负载平衡迁移，当以下情况强制性动作时：

ESXi主机进入维护模式
ESXi主机进入待机模式
违反规则
虚拟机的预留资源之和超过了主机的容量

强制移动可能在另一台主机上引起冲突，如果发生，DRS将在下一次调用时，移动虚拟机来修复这个新冲突，当群集存在多个规则这个场景可能发生。常见的一些迁移请求满足DRS的规则配置。

级别2（适度保守）

第2级别的迁移阈值仅适用于优先级1和优先级2的建议，优先级2建议保证群集负载平衡有很好的改善。

级别3（中性）

第2级别的迁移阈值是创建DRS群集的默认迁移阈值，这个中性的迁移阈值适用于优先级1.2和3的建议，保证群集负载平衡有好的改善。

级别4（适度激进）

第4级别的迁移阈值适用于多达4个优先级的所有建议，优先级4建议保证群集负载平衡适度的改善。

级别5（激进）

第5级别阈值是迁移阈值最右边的滑块，适用于所有5个优先级的建议，每个建议承若群集的负载平衡略有改善。

指导

一个第1级别的建议应该一直被接受，但清单中第5级别的一些建议，如果全部接受，也能共同改善群集。

当主机上的虚拟机运行着变化无常的工作负载，群集使用激进的迁移阈值会发生不必要的迁移。

适度的迁移阈值在这样的情况下更适合。当群集拥有同样配置的主机，运行着相对稳定的负载需求，激进阈值（第4级别，第5级别）将被考虑。

基本设计原则

默认适度的迁移阈值为迁移提供了一个比较高的容忍度，同时提供足够的平衡，算法考虑配置的阈值，并创建唯一值得依据的建议，默认设置通常为激进，通过主机足够去维护工作负载平衡，无需创建不必要的开销引起太频繁的迁移

转载于:https://blog.51cto.com/virtualbox/1198298

weixin_34130389

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
VMware vSphere 5.1 群集深入解析（十四）-DRS计算推荐

VMwarevSphere5.1ClusteringDeepdiveHA.DRS.StorageDRS.StretchedClustersDuncanEpping&FrankDennemanTranslateByTim2009/翻译：Tim2009目录版权关于作者知识点前言第一部分vSphere高可用性第一章介绍vSphere高可用性第二章...
复制链接

扫一扫