32 | 为什么还有kill不掉的语句？

久违の欢喜

已于 2023-03-07 15:14:04 修改

阅读量601

点赞数 1

分类专栏：《MySQL45讲》学习笔记文章标签： mysql kill query kill connection

于 2021-12-28 15:52:10 首次发布

本文链接：https://blog.csdn.net/TQ20160412/article/details/122193056

版权

《MySQL45讲》学习笔记专栏收录该内容

41 篇文章 10 订阅

订阅专栏

文章目录

MySQL45讲
- 实践篇
- - 32 | 为什么还有kill不掉的语句？
  - - 收到 kill 以后，线程做什么？
    - 三个关于客户端的误解

MySQL45讲

实践篇

32 | 为什么还有kill不掉的语句？

在 MySQL 中有两个 kill 命令：一个是 kill query + 线程 id，表示终止这个线程中正在执行的语句；一个是 kill connection + 线程 id，这里 connection 可缺省，表示断开这个线程的连接，如果这个线程有语句正在执行，也要先停止正在执行的语句。

大多数情况下，kill query/connection 命令有效。比如，执行一个查询的过程中，发现执行时间太久，要放弃继续查询，这时就可以用 kill query 命令，终止这条查询语句。

还有一种情况是，语句处于锁等待的时候，直接使用 kill 命令也是有效的。

在这里插入图片描述

收到 kill 以后，线程做什么？

当对一个表做增删改查操作时，会在表上加 MDL 读锁。所以，session B 虽然处于 blocked 状态，但还是拿着一个 MDL 读锁。如果线程被 kill 的时候，就直接终止，那之后这个 MDL 读锁就没机会被释放了。

kill 并不是马上停止的意思，而是告诉执行线程，这条语句已经不需要继续执行，可以开始“执行停止的逻辑了”。

当用户执行 kill query thread_id_B 时，MySQL 里处理 kill 命令的线程做了两件事：

把 session B 的运行状态改成 THD::KILL_QUERY(将变量 killed 赋值为 THD::KILL_QUERY)；
给 session B 的执行线程发一个信号。

疑问：为什么要发信号？

session B 处于锁等待状态，如果只是把 session B 的线程状态设置 THD::KILL_QUERY，线程 B 并不知道这个状态变化，还是会继续等待。发一个信号的目的，就是让 session B 退出等待，来处理这个 THD::KILL_QUERY 状态。

上述分析包含三层意思：

一个语句执行过程中有多处“埋点”，在这些“埋点”的地方判断线程状态，如果发现线程状态是
THD::KILL_QUERY，才开始进入语句终止逻辑；
如果处于等待状态，必须是一个可以被唤醒的等待，否则根本不会执行到“埋点”处；
语句从开始进入终止逻辑，到终止逻辑完全完成，是有一个过程的。

简单地说，kill 包含三步：

修改线程状态；
判断线程状态；
执行停止逻辑。

修改线程状态不会导致 kill 失败，而是判断线程状态（无法执行到该逻辑）和执行终止逻辑（耗时较长）会导致 kill 失败。

示例：

执行 set global innodb_thread_concurrency=2，将 InnoDB 的并发线程上限数设置为 2。

在这里插入图片描述

可以看到：

sesssion C 执行的时候被堵住了；
但是 session D 执行的 kill query C 命令却没什么效果；
直到 session E 执行了 kill connection 命令，才断开了 session C 的连接，提示“Lost
connection to MySQL server during query”，

执行 show processlist，看到下图：

在这里插入图片描述

id=12 这个线程的 Commnad 列显示的是 Killed。也就是说，客户端虽然断开了连接，但实际上服务端上这条语句还在执行过程中。

疑问：为什么在执行 kill query 命令时，这条语句不像第一个例子的 update 语句一样退出？

在实现上，等行锁时，使用的是 pthread_cond_timedwait 函数，这个等待状态可以被唤醒。但是，在这个例子里，12 号线程的等待逻辑是这样的：每 10 毫秒判断一下是否可以进入 InnoDB 执行，如果不行，就调用 nanosleep 函数进入 sleep 状态。

虽然 12 号线程的状态已经被设置成 KILL_QUERY，但是在这个等待进入 InnoDB 的循环过程中，并没有去判断线程的状态，因此根本不会进入终止逻辑阶段。

当 session E 执行 kill connection 命令时，是这么做的：

把 12 号线程状态设置为 KILL_CONNECTION；
关掉 12 号线程的网络连接。因为有这个操作，所以会看到，这时候 session C 收到了断开连接的提示。

KILL_CONNECTION 先把客户端的 sql 连接断开，后续执行流程走 kill query。

疑问：为什么执行 show processlist 的时候，会看到 Command 列显示为 killed ？

在执行 show processlist 的时候，如果一个线程的状态是 KILL_CONNECTION，就把Command列显示成Killed。

所以，即使是客户端退出了，这个线程的状态仍然是在等待中。

疑问：线程什么时候退出呢？

只有等到满足进入 InnoDB 的条件后，session C 的查询语句继续执行，然后才有可能判断到线程状态已经变成了 KILL_QUERY 或者 KILL_CONNECTION，再进入终止逻辑阶段。

kill 无效的情况：

第一类情况，线程没有执行到判断线程状态的逻辑。 跟这种情况相同的，还有由于 IO 压力过大，读写 IO 的函数一直无法返回，导致不能及时判断线程的状态。
第二类情况，终止逻辑耗时较长。 这时候，从 show processlist 结果上看也是 Killed，需要等到终止逻辑完成，语句才算真正完成。

第二类情况，比较常见的场景有以下几种：