记一次500万条数据查询的优化

最新推荐文章于 2024-05-21 10:49:41 发布

尹天遐

最新推荐文章于 2024-05-21 10:49:41 发布

阅读量3k

点赞数

分类专栏： SQL优化文章标签： SQL 500万条查询响应15s 查询优化

本文链接：https://blog.csdn.net/qq_31674229/article/details/102739724

版权

SQL优化专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.公司业务系统数据平台今早发现有个接口响应很慢，经过逐一排查后，发现问题所在。该接口是做的一个单表查询，表的数据有500万条左右。

下面是表结构

下面是优化前的查询

SELECT count(IP) as uvCount,visitDate from (
    select v.IP,DATE_FORMAT(v.CREATE_DATE,'%Y-%m') as visitDate from VISIT v
    where v.CREATE_DATE >= str_to_date(concat('2018-06-25',' 00:00:00'), '%Y-%m-%d %H:%i:%s')
    and v.CREATE_DATE <= str_to_date(concat('2019-10-25',' 23:59:59'), '%Y-%m-%d %H:%i:%s')
    group by IP
    -- and v.ID in (select a.ID from VISIT a group by a.IP having count(a.IP) <2)
    ) t3 GROUP BY visitDate ORDER BY visitDate ASC

跑下来的时间大概在15s左右。

下面是经过优化后的SQL

SELECT count(IP) as uvCount,visitDate from (
    select v.IP,DATE_FORMAT(v.CREATE_DATE,'%Y-%m') as visitDate from VISIT v
    where v.CREATE_DATE >= str_to_date(concat('2018-06-25',' 00:00:00'), '%Y-%m-%d %H:%i:%s')
    and v.CREATE_DATE <= str_to_date(concat('2019-10-25',' 23:59:59'), '%Y-%m-%d %H:%i:%s')
    -- group by IP
    and v.ID in (select a.ID from VISIT a group by a.IP having count(a.IP) <2)
    ) t3 GROUP BY visitDate ORDER BY visitDate ASC

跑下来用了4s左右。

总结：
如果数据量过大的查询，在子查询中尽量避免使用group by。
子查询中的group by 语句可以使用其他代替。
查询慢，先优化sql，sql优化不了再想其他办法。

尹天遐

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
记一次500万条数据查询的优化

1.公司业务系统数据平台今早发现有个接口响应很慢，经过逐一排查后，发现问题所在。该接口是做的一个单表查询，表的数据有500万条左右。下面是表结构下面是优化前的查询SELECT count(IP) as uvCount,visitDate from ( select v.IP,DATE_FORMAT(v.CREATE_DATE,'%Y-%m') as visitDate fro...
复制链接

扫一扫