is there a way to optimize the query without adding an index for every possible where clause?
是的,有点.但它需要了解INDEX的工作原理.
让我们看看你目前提供的所有SELECT.
>要为SELECT构建最佳索引,请从WHERE子句中的所有=常量项开始.将这些列以任何顺序放入索引中.这给了我们INDEX(状态,性别,……)或INDEX(性别,状态……),但它们之间没有任何决定(尚未).
>添加一个范围或所有ORDER BY.在你的第一个SELECT中,那将是生日.现在我们有INDEX(状态,性别,生日)或INDEX(性别,状态,生日).对于前两个SELECT,这些中的任何一个都是“最佳”.
这些索引对于#4非常有效:从ts_user_core中选择count(*),其中status =’ok’,gender =’female’.所以不需要额外的索引.
现在,让我们继续#3:从ts_user_core中选择count(*),其中(‘1990-01-01’和’2000-01-01’之间的生日);
>它不能使用我们到目前为止的索引.
> INDEX(生日)基本上是唯一的选择.
现在,假设我们也有…… WHERE status =’foo’; (没有性别).这将迫使我们选择INDEX(状态,性别,生日)而不是它的变体.
结果:2个好的索引来处理所有5个选择:
INDEX(status, gender, birthday)
INDEX(birthday)
建议:如果最终有超过5个INDEX或其中包含超过5列的索引,则缩短某些索引可能是明智之举.事情变得非常模糊.如果您想向我提供十几个“现实”索引,我会引导您完成它.
其他评论说明:
>对于计时,运行每个查询两次并第二次 – 以避免缓存效果. (你的3.6 vs 0.140味道就像缓存索引一样.)>对于计时,请关闭查询缓存或使用SQL_NO_CACHE.>优化器很少在单个查询中使用两个索引.>向我们展示EXPLAIN平原;我们可以帮你读一读.>在多个INDEX中选择的额外时间通常是值得的.>如果您有INDEX(a,b,c),则不需要INDEX(a,b).