MySQL的排序

最新推荐文章于 2022-09-24 19:04:09 发布

一生小白

最新推荐文章于 2022-09-24 19:04:09 发布

阅读量277

点赞数

分类专栏： MySQL 文章标签： MySQL

本文链接：https://blog.csdn.net/weixin_40048408/article/details/102544729

版权

MySQL 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

MySQL的排序优化

无论如何排序都是一个成本很高的操作，从性能角度考虑，应尽可能避免排序或者尽可能避免对大量数据进行排序。

我们都知道MySQL可以根据索引排序。当不能使用索引生成排序结果的时候，MySQL需要自己进行排序，如果数据量小则在内存中进行，反之，需要使用磁盘进行排序。MySQL将这个过程统称为文件排序，即使完全是内存排序不需要任何磁盘文件时也是如此。

如果需要排序的数据量小于“排序缓冲区”，MySQL使用内存进行“快速排序”操作。如果内存不够排序，那么MySQL会先将数据分块，对每个独立的块使用“快速排序”进行排序，并将各个块的排序结果存放在磁盘上，然后将各个排好序的块进行合并（merge），最后返回排序结果。

MySQL有两种排序算法：

1、两次传输排序（旧版本使用）

读取行指针和需要排序的字段，对其进行排序，然后再根据排序结果读取所需要的数据行，

这需要进行两次数据输出，即需要从数据表中读取两次数据，第二次读取数据的时候，因为是读取排序列进行排序后的所有记录，这会产生大量的随机I/O，所以两次数据传输成本非常高。当使用的是MyISAM表引擎的时候，成本可能会更高。因为MyISAM使用系统调用进行数据的去读（MyISAM非常依赖操作系统对数据的缓存）。不过这样做的优点是，在排序的时候存储尽可能少的数据，这会让“排序缓冲区”中可能容纳尽可能多的行数进行排序。

2、单次传输排序（新版本使用）

先读取查询所需要的所有列，然后再根据给定列进行排序，最后直接返回排序结果。因为不再需要从数据表中读取两次数据，对于I/O密集型的应用，这样做的效率高了很多。这个算法只需要一次顺序I/O读取所有的数据，而无需任何的随机I/O。缺点是，如果需要返回的列非常多、非常大，会额外占用大量的空间，而这些列对排序操作本身来说是没有任何问题的。因为单挑排序记录很大，所以可能会有更多的排序块要合并。

总结，两种算法都有各自最好和最糟的场景。当查询需要所有列，总长度不超过参数max_length_for_sort_data时，MySQL使用“单次传输排序”，可以通过调整这个参数来影响MySQL排序算法的选择。

一生小白

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MySQL的排序

MySQL的排序优化无论如何排序都是一个成本很高的操作，从性能角度考虑，应尽可能避免排序或者尽可能避免对大量数据进行排序。我们都知道MySQL可以根据索引排序。当不能使用索引生成排序结果的时候，MySQL需要自己进行排序，如果数据量小则在内存中进行，反之，需要使用磁盘进行排序。MySQL将这个过程统称为文件排序，即使完全是内存排序不需要任何磁盘文件时也是如此...
复制链接

扫一扫

专栏目录