AutoPliot-Flink任务自动调优

阿里基于Blink开发了VVP实时计算开发平台,其中有个模块是autopliot,可以做到任务的实时监控并且完成资源的自动调优和分配,以下是一些记录:

 

【实现策略】

  1. 基于CPU利用率
  2. 基于内存利用率
  3. 基于由于反压导致的delay,需要调整算子并行度
  4. 基于slot利用率
  5. 基于JobException的原因进行诊断(这是一个兜底策略,但也是最难广泛涵盖的情况,目前可以识别并解决的有:因为资源分配不足导致任务启动的时候抛出的OOM异常)

 

【注意事项】

  1. AutoPliot自动调整并发度是通过默认的并发度来实现的,因此作业每个节点都不能设置并发度,否则就无法实现动态调节。
  2. AutoPliot触发后需要重启作业(重启后可根据checkpoint恢复),会导致作业短暂停止处理数据。
  3. AutoPliot策略对作业的处理模式假设:流量平滑变化、不能有数据倾斜、每个算子的吞吐能力能够随并发度线性拓展,当作业pattern严重偏离这几个假设,可能会存在作业异常,没有触发scale,或者算法无法收敛,作业持续重启等异常情景,此时需要关闭AutoPliot手动调优。
  4. AutoPliot目前无法识别外部系统的问题:当外部系统故障,访问变慢时,会导致作业scale up,导致输出压力变大,会加重外部系统的压力,导致外部系统雪崩。
  5. AutoPliot目前不支持session cluster部署的作业。
  6. Deployment更新后需要手动重启作业。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值