查询mysql cpu 日志_数据库CPU 100%处理记录

问题描述

2020年7月13日一大早收到告警,测试环境数据库CPU告警。

登录aws查看监控如下图

0621c419d09cbf552f2e8812679061bd.png

问题分析

出现这种cpu 100%的问题,都是因为sql性能问题导致的,

主要表现于 cpu 消耗过大,有慢sql造成、慢sql全表扫描,扫描数据库过大,内存排序,队列等等

并发现写入相对于查询来说比较高(这是一个关键点)

有了大概的思路下边开始排查吧

查看进程

show full processlist;

44698c120fa120534bea0c162c8541d3.png

发现有大量的语句状态为 sending data

sending data: sql正从表中查询数据,如果查询条件没有适当索引,会导致sql执行时间过长。

查看慢日志配置

mysql> show variables like 'slow_query%';+---------------------+----------------------------------------------+

| Variable_name | Value |

+---------------------+----------------------------------------------+

| slow_query_log | ON |

| slow_query_log_file | /rdsdbdata/log/slowquery/mysql-slowquery.log |

+---------------------+----------------------------------------------+

2 rows in setmysql> show variables like 'slow_launch_time';+------------------+-------+

| Variable_name | Value |

+------------------+-------+

| slow_launch_time | 1 |

+------------------+-------+

1 row in set

看到慢日志已经开启

登录aws cloudwatch查看慢日志发现大部分为这条sql

# User@Host: admin[admin] @ [10.0.11.12] Id: 2302# Query_time:3.602910 Lock_time: 0.100585 Rows_sent: 2 Rows_examined: 4454SET timestamp=1594629311;

SELECT a.enum_value,a.bsh_enum_value

FROM external_mapping a

LEFT JOIN external_bsh_command_key b ON a.bsh_command_id=b.id

LEFT JOIN external_bsh_command_options c ON a.bsh_options_id=c.id

LEFT JOIN external_command_key d ON a.command_id=d.id

LEFT JOIN category h ON a.category_id=h.idwhere 1=1AND b.code='BSH.Common.Status.Event'AND c.code='BSH.Common.Setting.Rm4Valve'AND d.code='Rm4_Valve'AND a.platform_id=119AND h.cname= 'TT';

查看是否有锁表

mysql> show OPEN TABLES where In_use > 0;

#查看是否有锁表

SELECT*FROM INFORMATION_SCHEMA.INNODB_LOCKS;

#查看正在锁的事务

EmptysetSELECT*FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS;

#查看等待锁的事务

Emptyset暂时没有看到锁表的情况

查看缓存命中

mysql> show global status like 'Qca%';+-------------------------+-----------+

| Variable_name | Value |

+-------------------------+-----------+

| Qcache_free_blocks | 1 |

| Qcache_free_memory | 134199912 |

| Qcache_hits | 0 |

| Qcache_inserts | 0 |

| Qcache_lowmem_prunes | 0 |

| Qcache_not_cached | 44950579 |

| Qcache_queries_in_cache | 0 |

| Qcache_total_blocks | 1 |

+-------------------------+-----------+

8 rows in set说明:

Qcache_hits:查询缓存命中次数。

Qcache_inserts:将查询和结果集写入到查询缓存中的次数。

Qcache_not_cached:不可以缓存的查询次数。

Qcache_queries_in_cache:查询缓存中缓存的查询量。

查看到缓存命中为0%

查看引擎状态

mysql> show engine innodb status;

通过上边一系列的查询,发现以下几个问题

1、慢查询、全表扫描过多

描述

慢sql:查看到sql语句执行时间过长。

全表扫描:这个策略用于检查百分比((Handler_read_rnd+Handler_read_rnd_next)/(Handler_read_first+Handler_read_key+Handler_read_next+Handler_read_prev+Handler_read_rnd+Handler_read_rnd_next))。 这是一个需要读取全表内容的操作,而不是仅读取使用索引选定的部分。 通常使用小型查找表执行,或者在具有大型表的数据仓库情况下执行而其中所有可用数据都被聚合和分析。

建议

慢sql:根据sql 检查语句并进行索引优化。

全表扫描:应该尽量保持这个值尽可能的低。尝试隔离那些不使用索引的查询。一旦识别了那些查询,请创建适当的索引或重写查询以使用索引。MySQL 有一个很棒的功能 - 慢速查询日志,它允许你记录所有需要超过指定时间运行的查询。慢速速查询日志可用于识别需要很长时间才能完成的查询。

2、数据库最大并发连接数量

描述

当服务器启动后,(max_used_connections)变量将提供一个基准,以帮助你确定服务器支持的最大连接数量。 它还可以帮助进行流量分析。

建议

如果需要支持更多的连接,应该增加变量 max_connections 的值。MySQL 支持的最大连接数量是取决于给定平台上线程库的质量、可用 RAM 的数量、每个连接可使用多少 RAM、每个连接的工作负载以及所需的响应时间。

3、查询缓存要配置

缓存描述

这个策略用于检查查询缓存命中率(Qcache_hits/(Qcache_hits + Com_select))。 MySQL 查询缓存将缓存一个分析的查询及其整个结果集。 当你有许多小型的查询返回小型数据集时,这是非常好的,因为查询缓存将允许返回结果立即可供使用,而不是每次发生时都重新运行查询。

建议

理想情况下,查询缓存的命中率应该接近 100%。MySQL 的查询缓存是一项强大的技术,并且在管理良好的情况下可以显着提高数据库的吞吐量。一旦你的应用程序被创建,你可以看看它如何使用数据库,并相应地调整查询缓存。有足够大的缓存,避免碎片化和排除大型的查询,你就应该能够保持极高的缓存命中率,并享受出色的性能。

处理过程

根据上边发现的问题进行了配置的修改

1、修改慢查询以及全表扫描

此问题联系开发进行索引优化,减少全表扫描。

2、数据库最大连接数量

修改配置 max_user_connections 我这边设置的为1000

f4de6870757d23083961cccd904d4d36.png

3、查询缓存的配置

76c69ffffe9254e5fed8dfc089d1fd00.png

参数说明

query_cache_size:分配用于缓存查询结果的内存量。

query_cache_limit:不要缓存大于此字节数的结果。

query_cache_type:对于查询结果,不缓存(= OFF),不缓存NO_CACHE(= ON),或仅缓存(= DEMAND)分别用012 表示

修改完数据但是需要重启才能生效。

问题解决

正在准备空闲时间重启RDS的时候,开发那边有了进展。

开发同事把缓存写错了。

理下业务

程序暴露接口给测试部门,测试部门在上报了50W条数据,开发这边程序有没有添加数据过滤(过滤掉垃圾数据),并且...开发在程序中写错了缓存。所以导致相对于读取来说写入较高。因为在缓存查询不到想到的数据,就进行了全表扫描,继而出现了大量进程以及连接数队列等等。。

总结

处理问题可以,别主动背锅。。。在接手数据库的时候最好检查下配置,了解数据库的情况,在出现问题的时候能够最快速的定位解决问题。

另外,经过此次的故障处理,加固了对业务以及数据库一些参数的理解。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值