可观测的数据数据指标
- 服务应用:CPU利用率、内存、ygc次数
- 接口:核心关注接口的请求响应时间(平均响应时间、P90、P95,核心关注后面2个)、慢请求情况
- 数据库:主要关注CPU使用率、内存使用率
- Redis:主要关注CPU使用率、内存使用率、最大负载、网络使用情况
- ES:主要关注CPU使用率、内存使用率、最大负载、网络情况、磁盘使用率
量化数据
- 量化QPS和耗时的关系
- 量化QPS和系统资源的关系
压测目标
- 探查线上资源配置下,达到线上峰值QPS max 3倍时的资源使用情况以及过程的性能瓶颈
- 探查线上资源配置下的最高负载(最佳QPS max)
- 单个pod资源配置下可支撑的最高(最佳)QPS max(与线上qps成等比关系)
常见异常
参考资料:CPU、Load、内存及网络等系统指标异常的排查_GeorgiaStar的博客-CSDN博客_如何排查cpu、内存、网络io问题