容量预案(Capacity Plan)是容量管理的一个重要组成部分。
容量预警条件和措施:
类型 | 预警条件 | 措施 |
---|---|---|
应用服务器 | Load95分位值大于CPU核数的2倍 前一天CPU 95分位值大于90% 内存使用率95分位值大于90% | 增加应用服务器 |
数据库 | 数据库连接超过200 | 扩容DB服务规格/ 优化SQL查询性能 优化应用DB交互 |
网络 | 超过架构荣誉的50% | 购买或扩容带宽 |
缓存 | 缓存失效比例 缓存命中率低于某个值 | 增加缓存实例 |
容量预案要做好,需要关注几个要点:
- 明确的信息
明确启动容量预案的时间和条件,当真实的容量预警发生时可以缩短和减少执行容量预案的讨论时间和决策成本。 - 操作简洁
容量预案的操作步骤需要非常细致和明确,如果容量预警来得很突然,并且在主要负责人员无法立刻支持的情况下,那么任何一位开发工程师或运维工程师都能根据制定好的操作步骤进行“傻瓜式”操作和操作后的验证,保证容量预案达到预期效果。 - 操作安全可靠
有条件的情况下,所有容量预案都需要提前进行准备测试并演练,保证所列出的容量预案操作步骤是安全可靠的,那么实际执行容量预案时就不会有意想不到的问题。很多的容量预案会忽视这个步骤,所以在执行预案操作的时候就会碰到一大堆意想不到的问题,如对服务器进行扩容时,却有给应用服务器申请对应数据库的IP白名单等。 - 容量预案的监控和后续评估
容量预案执行期间和执行完毕后要进行实时监测和评估,用于后续的复盘和决策。发现原有容量预案的问题后并进一步优化容量预案流程,可以提高后续的执行效率。 - 提前储备资源,进行应急支撑