主要内容
服务资源基本估算
服务性能常用指标
打点组件介绍和使用
告警系统配置说明
服务资源基本估算
基本资源
4种基本资源:
- cpu:时间~程序耗时 * 服务负载
- 内存:在线运行空间~程序数据结构使用
- 磁盘:离线空间~文件存储
- 网络:外部资源~网络延迟和可达性
CPU
- 时间 ~ 程序耗时 * 服务负载
- 基本度量公式:1 CPU = 1 sec(秒)= 1000ms(毫秒)
- 假设服务A处理一次服务请求需要耗费稳定的50ms的CPU时间,则1个CPU在1sec秒时间内最多处理1000/50 = 20个请求。同理,假如当前服务的QPS为8,则该服务对1个CPU使用率为40%。
- 该计算不区分CPU密集型和IO密集型任务的区别,作为基本计算公式使用:
-
- 单核CPU使用率 = (单次服务耗时ms * 服务负载QPS) / 1000ms
-
- 多核CPU使用率 = (单次服务耗时ms * 服务负载QPS) / (1000ms * CPU逻辑核心数)
- cpu不够用了会怎样:
-
- 一般服务模式都是基于队列,任务被迫排队等待处理,表现为延迟指数级