[MySQL]记录一次线上故障处理过程--> has more than 'max_user_connections' active connections

org.mybatis.spring.MyBatisSystemException: nested exception is org.apache.ibatis.exceptions.PersistenceException:

### Error querying database.  Cause: org.springframework.transaction.CannotCreateTransactionException:Could not open JDBC Connection for transaction; nested exception is com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: User NUXUSER already has more than 'max_user_connections' active connections

......

### Cause: org.springframework.transaction.CannotCreateTransactionException:Could not open JDBC Connection for transaction; nested exception is com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: User NUXUSER already has more than 'max_user_connections' active connections

......


以上这是email报警信息,还有应用页面报500,503,504错误信息。



1   半夜接到call之后,马上登陆db,检查128组db节点组的状况,发现有db00701和db10201的connections超过了2000次。


2   想到这2台好像是上周刚维护过ssd的db server,直接ssh进取查看  ssh db00701


3  进入db00701之后,ps -eaf|grep mysql,运行正常,查看错误日志信息,发现写入binlog频繁报错。


4  进入binlog 目录/data/binlog/,发现目录下面有100多个binlog,足够有5天以上的binlog,奇怪怎么会有这么多,不是有crontab任务每天移走2天前的binlog吗?马上crontab -l发现移走binlog的任务没有开启,突然一想到,不会binlog目录磁盘满了吧?


5  执行df -h,看到/data/binlog/确实 used 为100%了,赶紧手动移走binlog,之后3分钟过后,应用正常了,页面不报5XX的错误了,db00701和db10201的connections也正常了。


总结问题原因有二:

1   此次数据库 db  server切换,山姆大叔的sa组在加监控的时候,粗心大意没有把binlog的监控给加上,所以没有及时报警通知磁盘满了。

2   我们db组也没有及时double confirmed这个monitor的事情。


看来以后还得更加仔细才行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值