压测出单机qps处理能力,实时监控线上服务qps,根据情况进行扩容或缩容
每个服务都需要有一个配置文件
[strategy]
#一个服务能够扛多少qps
speed_ratio = 2.5
#部署一个服务大概需要多少秒
start_time = 300
#每次部署多少个,至少为1
incr_num = 2
#固定机器有多少个
persistence = 16
算法大致流程:
-
取一段时间间隔内队列中消息速率,假设为A。
-
获取当前正在运行的服务数S。
-
计算当前已经启动的服务(固定+弹性分配)能够扛住的速率B(B=S*speed_ratio)。
-
假设队列中速率波动幅度C(通过观察流量波动写死的固定值)。
-
如果A>B+C,则申请新机器,根据配置文件,申请incr_num个机器,并部署服务。
-
如果A<B-C,则释放机器,根据配置文件,释放incr_num个机器,并下线服务。
-
注意要保持至少persistence指定的机器数,这些机器不能释放,它主要是应付平时低谷时的流量。
https://mp.weixin.qq.com/s/Sld16X-gfTzW6OxXaGdq6Q