一、背景
突然收到监控报警,显示tidb的使用内存超过了80%,基于一个DBA的直觉,想到这种情况是由于慢查询引起的
二、排查步骤
1.查看监控确定具体时间
cluster-Overview–>TiDB–>Memory Usage
2.定位对应的慢sql
在tidb查找慢sql有几种方式
2.1 dashboard中的sql语句分析/慢查询
2.2 information_schema的CLUSTER_SLOW_QUERY(所有节点慢sql)SLOW_QUERY(当前节点慢sql)
2.3 各个tidb节点的tidb_slow_query.log日志文件
3.特殊情况的慢sql定位
当你发现通过2的操作定位不到慢sql,所有sql基本都很快。那么是因为什么呢,这里要说明下,2的步骤所记录的慢sql都是正常执行完成慢sql,如果sql执行了很长时间,由执行人终止了,这种没执行完的sql是不会记录到2的内容中,那么这时候我们改怎么查呢
查看消耗内存大的全部操作,不管有没有执行完
cat tidb.log|grep expensive