放假的最后一天,的回答最近有一个小朋友问了一个关于 processlist 的问题,基于MYSQL 8 show processlist 到底从哪里来的信息,MYSQL 8 中提供processlist 信息的表与命令之间结果的不同。
MYSQL 的 SHOW PROCESSLIST 是每个MYSQL DBA 通过这个命令来获得MYSQL数据库当时访问的信息。
通过这个命令获得当前那些账号,通过什么样的方式,访问了那个DB 并且执行的命令的类型是什么,执行的时长是多少,命令当前的状态是什么,以及执行的语句信息等。
实际上这个show processlist 等同于 select * from information_schema.processlist;
我们的访问的信息均来自information_schema 数据库中的 processlist 表中。在MYSQL 8.022 之前获取这些信息是需要根据线程管理模块通过全局互斥的方式来获得数据。
在MYSQL 8.022 版本后,MYSQL 可以通过另一个方式来获得这些信息,performance_schema 中获得这个信息,结果与show processlist 与 select* from information_schema.processlist; 一致。利用这样的方式获得的信息不用再通过线程管理器中获得信息,也就不在需要互斥了。
同时在sys schema 中也提供了processlist 信息,但这个信息的内容相对原有的 processlist的内容属于天差地别的。
通过sys schema 中获得的信息,可以判断当时语句执行的
1 延迟时间
2 锁定的时间
3 是否采用临时表
4 查询对于表的影响, 影响多少行,是否属于全表扫描
5 这个线程最后运行的语句信息
6 语句执行的时间
7 语句分配的内存
8 事务的状态,以及事务对应的 PID 信息
具有以上的信息后,一个mysql thread 运行中的信息都已经获得,基于MYSQL 8 在获取 show processlist 信息的方式可以改变了,不在使用原有的方式获得信息。
那么的说说为什么在MYSQL 8 中不在建议使用原有的方式来获得系统的信息。
1 传统的show processlist , select * from information_schema.processlist, mysqladmin processlist --verbose 这三种传统的方法都是通过线程管理器进行全局互斥量的操作。
2 针对繁忙的系统,频繁的操作对系统的性能是有影响。
为什么不要在使用传统的方式收集,而是使用 performance_schema 中的 processlist 表中获得数据,不在通过全局互斥的方式跨线程管理器获得信息,针对繁忙的系统不会影响系统的性能,将影响降低到最小。
在MYSQL 8.022 后,建议使用的查看 processlist 的方式是
1 show full processlist
2 select * from performance_schema.processlist;
实际上 information_schema 和 performance_schema 中的processlist 除了在上面的说道的性能的不同,在表的结构上也有不同。performance_schema 中新的 processlist 显然和原来的表结构设计是有区别的。
最后一个问题,在8.022 版本及以上的情况下,我们执行 show processlist到底是从 information_schema中获得的数据,还是从performance_schema 中获得的信息,这里默认还是通过 information_schema 获得的信息,如果要从performance_schema 获得信息,可以在系统中打开开关
show global variables like 'performance_schema_show_processlist';
set global performance_schema_show_processlist='ON';
此时在敲击 show processlist ,信息就切换到 performance_schema中,不在从 information_schema 中获得。
除此以外,还有一些关于performance_schema 的配置需要进行确认和设置,会在MYSQL PS SYS INFO 的系列里面介绍。