最近面试过程中被面试官抛了一个问题,说曾经有一个线上出现的奇怪的问题,主库和从库各种配置是一致的,当数据量比较大的时候,某些时候同样的查询,在从库里的执行计划执行成功了,而主库里没有执行这个执行计划,问我这是为什么?
当时我的回答是主库偏重于写数据,从库偏重于读数据,既然mysql的查询语句执行计划是有可能改变的说明mysql的语句执行计划是可能随着数据的变化而发生调整的,如果分析是认为原定执行计划没有成功执行,那么我们可以对执行计划进行控制,也许自己可以进行配置。答案明显是错的,我只是根据自己对问题的理解进行了想法的阐述。
那么真正的情况如何呢?其实答案就是隐藏在那些理所当然的思路的背后。众所周知,mysql的索引不能建的太多,因为mysql在数据增删比较频繁的情况下需要花费大量资源进行重建索引。而mysql有协调机制,如果一段时间内数据量变化较大,会将调整索引的计划推迟,直至判断数据变化不大的时候才会去重建索引。所以这就造成了,mysql在评判不同的执行计划的时候,如果突然新增的数据量很大,不走索引反而比走索引所花费的时间更短,就相应的将执行计划调整为不走索引。
因此,在数据量变化较大的时候进行主库查询,其实可以对应先判断一下不同执行策略所耗费的时间,如果走索引耗费的时间更长,说明索引没有重建完成,可以进行手动重建索引,然后再进行判断执行计划之间的时间差异。之后mysql的执行计划选择器自然会判断出正确的执行计划。