30、无状态数据处理集群最佳维护时间选择与云资源管理探讨

无状态数据处理集群最佳维护时间选择与云资源管理探讨

集群维护时间确定方法

在处理无状态数据的集群维护中,阈值的确定至关重要。通过将紧急级别视为百分位值,能够轻松获取阈值,即 AWthre = PLevelurg 。例如,对于紧急级别为 1 的低紧急维护请求,会选择 P1 值,这里的 P1 表示所有值中 1% 低于该值。

  • CL 方法 :预测的工作负载表明在预测期内任何时间同时运行的作业数量。阈值基于分析的工作负载和维护紧急程度确定。未来预测工作负载强度低于阈值的时间戳,就是可能的集群维护开始时间。
  • AW 方法 :预测的工作负载会扣除未来任何时间的累计工作量。选择相应的阈值后,与 CL 方法类似,即可确定维护时间。

确定集群维护阈值后,通过将实时工作负载与阈值进行比较,就能确定维护时间。具体步骤如下:
1. 定期查询 Hadoop 作业历史服务器,周期为 Tjh
2. 获取作业历史信息的快照,并提取所有作业。
3. 对于每个正在运行的作业 Ji ,收集所有已完成或正在运行的任务 Tmr
4. 迭代所有任务,将消耗的计算资源聚合为 AWaggr
5. 将聚合的 AWaggr 与阈值 AWthre 进行比较。如果 AWag

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值