sql 关联使用id还是code_一条sql优化之虚拟列、group by

最新推荐文章于 2023-05-15 22:29:58 发布

weixin_39846612

最新推荐文章于 2023-05-15 22:29:58 发布

阅读量299

点赞数

文章标签： sql 关联使用id还是code sql 按小时备份的文件都很大 sql中result转换成int sql按时间排序联表可以取出不在groupby里的字段么

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39846612/article/details/111297961

版权

本文探讨了SQL查询优化中的两个关键技巧：虚拟列和GROUP BY优化。针对对时间列进行函数运算导致无法使用索引的问题，提出通过创建虚拟列并建立索引来改善查询性能。此外，还讲解了GROUP BY操作的优化，包括调整tmp_table_size和sort_buffer_size参数，以及如何避免使用磁盘临时表。文章通过实例展示了优化前后的查询计划，强调了优化对查询效率的影响。

摘要由CSDN通过智能技术生成

接到一个sql优化问题，开发同学给了我sql语句，需要帮忙优化一下。

带出两个sql优化的技巧。虚拟列和group by优化

看下sql语句：了解下下背景：

-- 按时间统计,最近1小时,每10分钟间距统计

- 按时间统计,最近7天,每天间距统计

-- 按时间统计,最近30天,每天间距统计

大概知道慢在哪里了。

对时间列进行函数运算，排序、分组等，对排序列运算，用不了索引。

优化：

MySQL虚拟列,将对列运算的函数单独抽取为一个列,并建立索引。

group by 优化：包括sort_buffer_size tmp_table_size等

SELECT

DATE_FORMAT(

concat( date( a.create_time ), ' ', HOUR ( a.create_time ), ':', floor( MINUTE ( a.create_time ) / 10 ) * 10 ),

'%Y-%m-%d %H:%i'

) time,

COUNT(id) timeCount

FROM

mq_receive_history a

WHERE

a.create_time >= DATE_SUB(NOW(), INTERVAL 1 HOUR)

and a.code = 'heartbeat' and a.del_flag = 0

GROUP BY time

ORDER BY time;

表结构：

CREATE TABLE `mq_receive_history` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`create_time` timestamp(0) NULL DEFAULT NULL,

`update_time` timestamp(0) NULL DEFAULT NULL,

`del_flag` bit(1) NULL DEFAULT NULL,

`code` varchar(255) ,

`gid` varchar(255) ,

`uid` varchar(255) ,

`msg_id` varchar(255) ,

`receive_time` timestamp(0) NULL DEFAULT NULL,

`data` longtext,

`receive_message`,

`error_code` int(11) NULL DEFAULT NULL,

`error_msg` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,

`is_ui_run` bit(1) NULL DEFAULT NULL,

`is_system_login` bit(1) NULL DEFAULT NULL,

`code_run_id` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,

PRIMARY KEY (`id`) USING BTREE,

INDEX `p_code`(`code`) USING BTREE

) ENGINE = InnoDB;

查看sql查询计划

不出所料:Using where; Using temporary; Using filesort

虚拟列优化：

修改表结构，把对createtime列每10分钟运算固化为函数列，

并在上面建立索引，这下只需要对这个列分组即可，也可以用到索引。

使用这种优化也有优劣

1.当在表里读取记录的时候，virtual类型的会进行实时的计算。

2.当写入一条记录的时候，stored类型会通过计算，写入表中，

和常规的字段的一样的占用磁盘的空间。

3.这两种类型都可以有NOT NULL限制，但是能使用索引的一部分的功。

(不能使用主键索引和全文索引(fulltext index))

需要注意：虚拟列有两种类型：一种是VIRTUAL(MySQL默认) 一种是STORED

VIRTUAL:建议采用，数据不持久化到磁盘，数据实时计算

STORED:性能相比VIRTUAL稍差，数据持久化到磁盘，试用于需要持久化数据场景

添加虚拟列：

ALTER TABLE `demo`.`mq_receive_history`

ADD COLUMN `createtime_per_ten_min` varchar(20) AS

( concat( date( a.create_time ), ' ', HOUR ( a.create_time ), ':', floor( MINUTE ( a.create_time ) / 10 ) * 10 )) VIRTUAL NULL AFTER `code_run_id`;

添加索引：

ALTER TABLE `demo`.`mq_receive_history`

ADD INDEX `idx_mq_rec_createtime_per_min`(`createtime_per_ten_min`) USING BTREE;

修改后，在看sql语句查询计划：使用到了索引，查询效率也大幅度提高。using filesort也不见了(排序在内存临时表中完成了)

接下来看下group by优化点：

使用了group by 一般伴随着：

using temporary：使用了内存临时表

using filesort：使用了排序操作

group by 原理可以去查阅相关文档看下(可以看下丁奇老师的《MySQL实战45讲》)

group by 的语义逻辑，是统计不同的值出现的个数，因此需要一个临时表来统计。

优化时候也可以通过查看下面参数：

show global status like '%Created_tmp_tables%'

show global status like '%Created_tmp_disk_tables%'

分组排序数据量小的时候适当调大：tmp_table_size可以让临时表不使用磁盘，速度很快。

using filesort：

如果数据量很大的时候，临时表会不会占用很多内存空间，

到内存空间 sort_buffer不够用的时候，还是需要用到磁盘空间。

也可以使用SQL_BIG_RESULT 这个提示(hint)，

就可以告诉优化器：这个语句涉及的数据量很大，请直接用磁盘临时表。

总结：

1、如果对 group by 语句的结果没有排序要求，要在语句后面加 order by null；

2、尽量让 group by 过程用上表的索引，确认方法是 explain 结果里没有

Using temporary 和 Using filesort；

3、如果 group by 需要统计的数据量不大，尽量只使用内存临时表；

也可以通过适当调大 tmp_table_size 参数，来避免用到磁盘临时表；

4、如果数据量实在太大，使用 SQL_BIG_RESULT 这个提示，

来告诉优化器直接使用排序算法得到 group by 的结果。

weixin_39846612

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sql 关联使用id还是code_一条sql优化之虚拟列、group by

接到一个sql优化问题，开发同学给了我sql语句，需要帮忙优化一下。带出两个sql优化的技巧。虚拟列和group by优化看下sql语句：了解下下背景：-- 按时间统计,最近1小时,每10分钟间距统计- 按时间统计,最近7天,每天间距统计-- 按时间统计,最近30天,每天间距统计大概知道慢在哪里了。对时间列进行函数运算，排序、分组等，对排序列运算，用不了索引。优化：MySQL虚拟列,将对...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。