两个表join查询,explain查询执行计划的时候不走索引,这时候可以检查两张表字符集对应的字段的字符集,字符集对不上会造成索引失效的问题。
造成本次问题的原因是:有些旧表需将原来utf8迁移为utf8mb4,但只更改了表的字符集,而漏了更改字段的字符集。这一点以后需要注意。
另外在排查的过程当中,还发现字符集对不上的情况下,join查询中对select count的影响最大,两张几千级的表join查询可能需要耗时十几秒,在对于left join而言,左表关联列的字符集为utf8,右表关联列的字符集为utf8mb4的时候,由于utfmb4是utf8的超集,select count的速度还是很快的,但反过来就会造成慢查询的问题。对select * 的情况,utf8和utf8mb4左右表顺序调换的影响比较小,估计数据量一大起来估计也还是会出现瓶颈的,只不过select count的来得更早一些罢了。所以还是尽量统一字符集。
下图是关于MySQL8.0官方文档关于使用索引的介绍,也提到了在非二进制的字符集的比较重应该尽量使用相同的字符集。
链接:https://dev.mysql.com/doc/refman/8.0/en/mysql-indexes.html