最近在优化一个统计的接口,在几十万的数据统计下,接口处理的响应时间达到了20s。看了下代码逻辑,发现其中主要有三个主要的统计方法,在优化了其中一个方法的统计逻辑后。接口的响应时间下降到了3s内。还是没有达到期望的响应时间(1s内)。看了下另外两个方法的SQL语句,其中一个查询时间达到了两秒多,如下:
SELECT
FLOW_TO AS flowTo,
COUNT( DISTINCT RELATED_ID ) AS count
FROM
or_flow_schedule
WHERE
DATE_FORMAT( CREATE_TIME, '%Y-%m-%d' ) = DATE_FORMAT( NOW(), '%Y-%m-%d' )
GROUP BY FLOW_TO
在看了SQL语句后,给表加了以下的索引
explain后
发现并没有走刚刚建的那个索引,根据索引的原理和查询的原则(这两个不清楚的可以自行去了解),觉得有可能是DATE_FORMAT导致的索引失效了,后面发现确实如此,参考mysql DATE_FORMAT导致索引失效
将date_format替换为between and
SELECT
FLOW_TO AS flowTo,
COUNT( DISTINCT RELATED_ID ) AS count
FROM
or_flow_schedule
WHERE
CREATE_TIME BETWEEN '2021-11-18 00:00:00' and '2021-11-18 23:59:59'
GROUP BY FLOW_TO
此时走了开头建的那个索引了,影响的行数也从开始的25W降到了641,查询时间也降到了0.2s