1.1 数据库的基本信息
数据库品牌:RDS MySQL
类型及系列:常规实例 (高可用版)
CPU:4
内存:8
规格族:通用型
最大IOPS:5000
最大连接数:2000
内核小版本:20200229
数据库版本:8.0.16
1.2 故障说明
01:CPU使用率增加到100%+后,它不下降,业务低峰期间也不下降。
# 晚上重启mysql实例后,CPU使用率会下降,但管不了几天(有时两天,有时三天),又100%+了,且还不下降。
02:至于CPU 100%时观察监控的情况,请看1.3章节。
03:最后在阿里云上提交工单才解决。
A:第一次提交工单时:没处理掉,说是有慢sql
B:第二次提交工单时:处理掉了,说是需要升级内核版本(不是mysql版本)
1.3 100%时我捕捉到的信息
查看是否有慢SQL,结果是没有的
show full processlist; 的结果说明,我当时是用的超级用户登录
command字段:除了主从的一些线程,就是sleep线程,有三十几个
state字段:没有任何的信息
查看性能趋势:ops不超过100,对应阶段的CPU是100%+,tps就更低了。
诊断报告
cpu:当然是100%
慢查询top10:是有的,但是在cpu 100%时是没有慢SQL的
死锁:没有的
1.4 问题的处理
提交工单,其得到的结果是需要升级内核小版本,其截图如下所未
当时cpu使用率就断崖式的降到了3%。
内核小版本升级后的性能趋势
第二天凌晨2点进行了内核小版本的升级,升级后其性能趋势如下所示
数据库品牌:RDS MySQL
类型及系列:常规实例 (高可用版)
CPU:4
内存:8
规格族:通用型
最大IOPS:5000
最大连接数:2000
内核小版本:20200630
数据库版本:8.0.18