Duration 相关
延迟相关的时间
Grafana 监控TiDB —> Query Summary —> Duration
duration: 就是所有SQL的平均执行时间。
99.9% SQL响应是按小于8ms 99% 小于4ms
Grafana 监控TiDB —> Query Summary —> 999 Duration/99 Duration/95 Duration/80 Duration
Grafana 监控TiDB —> Query Detail —> Duration 80/95/99/999 By Instance
QPS相关
Grafana 监控TiDB —> Query Summary —> QPS
Grafana 监控TiDB —> Query Summary —> CPS
CPS: command 例如 select 1 ; select 1; 发出了两条SQL,但只属于一个command
Grafana 监控TiDB —> Query Summary - Internal SQL QPS
压测的时候会关注,平常基本不怎么关注
Transaction 相关
Grafana 监控TiDB —> Transaction - Duration
事务的平均响应时间。
optimistic: 乐观事务 ; pessimistic: 悲观事务
Grafana 监控TiDB —> Transaction - Transaction Statement Num
事务出的问题,往往是大事务出现了。Transaction - Transaction Statement Num: 事务内部的语句量
Grafana 监控TiDB —> Transaction - Transaction Retry Num
这个只和乐观事务有关系
资源相关
Grafana 监控TiDB —> Server - CPU Usage
Grafana 监控TiDB —> Server - Memory Usage
Grafana 监控TiDB —> Server - Connection Count
Grafana 监控TiDB —> Server - Get Token Duration
连接虽然不做限制,但执行SQL前,需要获取Token,拿到token的sql才可以被处理,没有拿到的就需要等待。 如果这个延迟很高,则表示SQL需要等很久才能拿到token。
PD/TiKV关联指标
Grafana 监控TiDB —> PD Client - PD TSO Wait/RPC Duration
Grafana 监控TiDB —> KV Request - KV Request Duration 99 by store/type
Grafana 监控TiDB —> KV Errors - KV Backoff OPS
kv返回 重试的次数
Grafana 监控TiDB —> KV Errors - KV Backoff Duration