mysql之order by工作原理

前言

order by相比大家都用过,它的用法我就不再多介绍了,今天我们主要是介绍order by在mysql 的中的工作原理,方便大家可以更加熟练的使用order by。

全字段排序

首先我们先创建一个表,下面是建表的sql语句


CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `city` varchar(16) NOT NULL,
  `name` varchar(16) NOT NULL,
  `age` int(11) NOT NULL,
  `addr` varchar(128) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `city` (`city`)
) ENGINE=InnoDB;

然后我们根据name排序,查出来前一千条,杭州的


select id,city,name,age,addr from t where city='杭州' order by name limit 1000  ;

这里我们给city建一个索引,大家不要给city和name建一个联合索引(如果见了联合索引,这个直接就是有序的,他就不会再去排序了,我们就没法看到这个order by的执行过程了)。之后我们用explain语句看下这个sql 的执行过程。
在这里插入图片描述
这个extra中的using filesort,就是表示需要排序,然后mysql会给每一个线程分配一个sort buffer用来排序。

然后这个排序过程大致分为一下几步
1.走索引查找到到city为杭州的城市的id
2.通过id将值取出来放到sortbuffer中
3.在sort buffer中,将数据按照name排序,取出前一千行,将结果返回

上面就是order by在mysql中的大致执行过程

但是还有一个点就是,在使用sort buffer 排序的时候,可能会用到外部空间,当排序的数据大小大于sort buffer 的大小的时候,就会用到外部磁盘临时文件排序。下面是查看一个语句是否使用了磁盘临时文件排序


/* 打开optimizer_trace,只对本线程有效 */
SET optimizer_trace='enabled=on'; 

/* @a保存Innodb_rows_read的初始值 */
select VARIABLE_VALUE into @a from  performance_schema.session_status where variable_name = 'Innodb_rows_read';

/* 执行语句 */
select city, name,age from t where city='杭州' order by name limit 1000; 

/* 查看 OPTIMIZER_TRACE 输出 */
SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G

/* @b保存Innodb_rows_read的当前值 */
select VARIABLE_VALUE into @b from performance_schema.session_status where variable_name = 'Innodb_rows_read';

/* 计算Innodb_rows_read差值 */
select @b-@a;

在这里插入图片描述

这个代表用了12快临时文件,外部排序使用的是归并排序。

select @b-@a 的返回结果是 4000,代表扫描了4000行

rowid排序

上面排序的时候,却将整行数据都放进去了,但是我只需要对name字段排序,那么其他字段是不是可以不要呢。答案当然是可以的。


SET max_length_for_sort_data = x;

你可以将排序放入的每行记录设置一个大小,我就之放入name,那么sort buffer,就会存储的是city为杭州的4000行记录的name,然后排序得出前一千行name,再去主键索引树上取出对应的数据,返回给用户。

这样的话,确实放入sort buffer的数据变小了,但是却多了一次回表(这会增加时间损耗,那个外部临时时间排序也会增加时间损耗),而且扫描行数也会变成5000。

总结

如果可以的话,尽量将sort buffer 设置的大一点,能够将所有的排序数据放入其中,这样查询速度比较快,如果内存比较小的话,就可以使用rowid排序。总之就是,用空间换时间,或者用时间换空间(这是算法中常用的一种思想)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
MySQLorder by原理是通过利用索引顺序或者使用rowid排序来实现数据的排序。当查询语句的order by条件和查询的执行计划中所利用的索引的索引键完全一致,并且索引访问方式为rang、ref或者index时,MySQL可以直接取得已经排好序的数据,而无需进行实际的排序操作。对于单行数据过长的情况,MySQL将使用rowid排序,即根据行数据的长度进行排序。此外,MySQL为排序开辟了一个内存区域称为sort_buffer,如果要排序的数据量小于这个内存区域的大小,则会在内存中进行排序。总的来说,MySQLorder by原理是根据索引顺序或者行数据的长度来排序数据,并且使用sort_buffer来存储排序的数据。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Mysqlorder by 的原理](https://blog.csdn.net/ADi_1998/article/details/106590037)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [MySQLorder by的工作原理](https://blog.csdn.net/Longstar_L/article/details/107372892)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mark---小鑫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值