CREATE TABLE `parent` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`val` varchar(10) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB;
CREATE TABLE `child` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`parent_id` int(11) DEFAULT NULL,
`val` varchar(10) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_parent` (`parent_id`),
CONSTRAINT `fk_parent` FOREIGN KEY (`parent_id`) REFERENCES `parent` (`id`) ON DELETE CASCADE ON UPDATE NO ACTION
) ENGINE=InnoDB;
INSERT INTO `parent` VALUES (1, "one"), (2, "two"), (3, "three"), (4, "four");
Session 1:
start transaction;update parent set val = "four-new" where id = 4;
Session 2:
alter table child add index `idx_new` (val);
Session 3:
start transaction;update parent set val = "three-new" where id = 3;
此时,会话 1 具有打开的事务,并且处于休眠状态,并在父级上授予写入元数据锁定。 会话 2 具有在子级上授予的可升级(写入)锁定,并且正在等待父级的读取锁定。最后会话 3 具有针对父级的授权写入锁定:
mysql> select * from performance_schema.metadata_locks;+-------------+-------------+-------------------+---------------+-------------+| OBJECT_TYPE | OBJECT_NAME | LOCK_TYPE | LOCK_DURATION | LOCK_STATUS |+-------------+-------------+-------------------+---------------+-------------+| TABLE | child | SHARED_UPGRADABLE | TRANSACTION | GRANTED |
请注意,具有挂起锁定状态的唯一会话是会话 2(ALTER)。会话 1 和会话 3 (分别在 ALTER 之前和之后发布)都被授予了写锁。排序失败的地方是在会话 1 上发生提交的时候。在考虑有序队列时,人们会期望会话 2 获得锁定,事情就会继续进行。但是,由于元数据锁定系统的优先级性质,会话 3 具有锁定,会话 2 仍然等待。
如果另一个写入会话进入并启动新事务并获取针对父表的写锁定,则即使会话 3 完成,ALTER 仍将被阻止。
只要我保持一个对父表打开元数据锁定的活动事务,子表上的 ALTER 将永远不会完成。更糟糕的是,由于子表上的写锁定成功(但是完整语句正在等待获取父读锁定),所以针对子表的所有传入读取请求都将被阻止!
另外,请考虑一下您通常如何对无法完成的语句进行故障排除。您查看已经打开较长时间的事务(在进程列表和 InnoDB 状态中)。但由于阻塞线程现在比 ALTER 线程更年轻,因此您将看到的最旧的事务/线程是 ALTER 。
这正是这种情况下发生的情况。在准备发布时,我们的客户端正在运行 ALTER 语句并结合负载测试(一种非常好的做法!)以确保顺利发布。问题是负载测试保持对父表打开一个活动的写事务。这并不是说它只是一直在写,而是有多个线程,一个总是活跃的。 这阻止了 ALTER 完成并阻止对相对静态的子表的随后的读请求。
幸运的是,这个问题有一个解决方案(除了从设计模式中驱逐外键)。变量 max_write_lock_count[2] 可用于允许在写入锁定之后在读取锁定之前授予读取锁定连续写锁。默认情况下,此变量设置为 18446744073709551615,如果你对该表发出 10,000 次写入/秒,那么你的读将被锁定 5800 万年……