在使用阿里 drds 过程中因为问题现象比较诡异,故做如下记录发现。多条 DDL 无法执行成功,导致表锁死或卡死状态。
数据库现象
- 无响应。进行表操作(写或修改表结构)时发现在正常时间内本应返回操作结果的但无响应;
- 连接不上数据库。服务包大量 unkownhost 异常,查看数据库连接信息大多 sleep 或者 pending;
- 一些莫名的异常现象,例如删除表时,ddl 卡死,但表在可视化工具中已无法查看,然后创建表是提示表已存在等现象;
相关知识
# 查看全部正在执行的 ddl job
show full ddl;
# 检查异常表
check table tablename;
# 删除指定 ddl job
remove ddl 1338684140034232320;
# 恢复指定 ddl job
RECOVER ddl 1338684140034232320;
# 回滚指定 ddl job drop 操作无法回滚
ROLLBACK ddl 1338684140034232320;
解决方案
- 可以查询正在运行的ddl语句,通过 jobId 进行删除、恢复、回滚操作,最后再进行检查即可,这方案一般能解决大部分问题;
- 如果第一种方案无法解决,那恭喜,请评估是否可以重启数据库吧。
最后建议使用官方推荐的数据库工具进行连接执行SQL脚本。官方有推荐使用 MySQL Workbench(推荐)、SQLyog、Sequel Pro、Navicat for MySQL