sql server排序慢_SQL分页查询方案的性能对比

b28a58ce9f927fda8f9e8782f2c81cbe.gif

51fc8c7f96b4db1a7b3351be45b624e4.png

作者 | 中国农业银行 吴海存 责编 | 晋兆雨 头图 | CSDN下载自视觉中国

f1ee5963ee597bc98e3c703eb6bbd961.png

导读

本文主要介绍了基于ROWNUM、主键列/非空唯一性列、分析函数、OFFSET-FETCH NEXT机制的几种SQL分页查询方案的性能对比。

分页查询可分为逻辑分页和物理分页两种。逻辑分页是应用代码级别实现的分页,指用户通过一次查询就取出所有的数据结果集并进行缓存,然后根据当前页所需要展示的数据内容进行切分并遍历显示,若需要查询的数据量非常大,则会消耗大量的内存来缓存数据,并且在会话生命周期内重复访问数据时,可直接访问缓存的数据,不过此时有可能访问不到最新的数据。物理分页是指使用数据库自带的分页机制,比如MySQL的limit offset机制,Oracle的rownum和offset-fetch机制进行分页查询,是对数据库表数据进行分页条件查询,每一次物理分页都会直接访问数据库,可以保证数据是最新的,并且不需要在会话级别缓存过多的数据。

本文主要介绍的SQL分页,即物理分页,主要用于在数据结果集较大时控制数据在前台(比如报表,列表框,页面等)的分页显示,这样既可以降低内存消耗,提高查询效率,也可以方便数据在前台的展示。文中如有疏漏之处,望指正!

cf1862dafb7313ab492c295fa2b883ed.png

环境版本信息

  • Oracle 版本:19.3.0.0.0

  • MySQL版本:8.0.18

  • OS版本:CentOS 8.0

deb2a458a031d53abf5ee375aa2ef3cb.png

方案及性能对比

1.确认测试表emp中的数据量

53141a7a05fe51009c308a7eef61ea0c.png

2.确认表结构和索引信息

8d8ec9621f00a5c818bd70adb00b55c3.png

3.通过rownum实现分页查询(不使用order by排序)

SQL: select * from ( select rownum rowno,e.* from emp e where rownum<=&ROW_NUM1) t where t.rowno>=&ROW_NUM2;

 执行计划信息:

137317f85d1253c523843e7f2069ef71.png

5874da87d155b2d8f1f3fa348ec61720.png

通过执行计划和评估开销可以看出,该方法将使用全表扫描,前段的分页查询效率会比较高,但是随着ROWNUM值的增大,在分页后期查询的速度会越来越慢,这个情况和MySQL的limit机制一样,当表中数据量较大时,随着查询范围的扩大,每次需要读取的表数据块越来越多,查询效率越来越低。如下图所示:

2d14c5b7e828caff550746c3a306bf95.png

bdbc558a874dac5c91dd43ed99f27a5b.png

4.通过rownum实现分页查询(使用order by排序)

SQL: select * from ( select rownum rowno,e.* from (select * from emp order by id) e where rownum<=&2) t where t.rowno>=&1;

执行计划信息:

e05019614b8e7496962b455449549cc2.png

975ec5c12f5122a7c8c4fb243febc402.png

由执行计划信息可以看出,当使用order by对数据集进行排序后再分页时,由于索引数据在存储的时候默认已经进行了升序排序(若有需要,也可以创建降序索引,该案例是基于Oracle环境,对于MySQL数据库,从8.0开始也支持了真正意义的降序索引),因此使用了索引全扫描(即索引遍历)来避免排序,后期需要遍历的索引块越来越多,并且由于index full scan是单块读,所以该方法会出现在分页后期查询效率越来越慢的情况。如下图所示:

eabd0b5bc68aa29986c8e58101dfe5f0.png

5.直接使用主键代替ROWNUM进行分页查询

查出id的最大值和最小值:

f4ea56b59e80675b4ff7573785202563.png

SQL: select * from emp where id between &1 and &2;

执行计划信息: 

b0c4aed395afdbcac4233465084f886d.png

36e06c2114f45692223dd99e969b6cd0.png

从执行计划信息可以看出,该方法使用了主键索引的range scan,当表数据量较大时,不会出现随着查询范围的扩大而查询效率越来越低的情况,因为可以直接通过主键或非空唯一性索引读取到符合条件的rowid,然后直接通过rowid找到数据块读取数据,如下图所示:

6ac63a126a0060e96ec987e72dfce683.png

说明:

  • 该方法需要主键值是连续的,否则有可能出现分页查询时每一页的数据行数不一样的情况。

  • 假如表上有其他的非空唯一性索引列,则同样可以基于该列做分页查询。

  • 若在分页查询时表上有一定的DML操作,则可以考虑进行最后一页查询时将SQL中的变量2设置较大一些(也可以通过子查询直接获取max(id))。

6.使用分析函数进行分页查询

SQL: select * from ( select e.*, row_number() over (order by id) rn from emp e) where rn between &1 and &2; 

执行计划信息:

3e0bc365d0fd25889ace8d9148684729.png

a6818a6db08e15323251a646c4959628.png

从执行计划信息可以看出,该方法使用了窗口函数进行分页查询,同样使用了INDEX FULL SCAN来避免排序,该方法也会出现在分页后期查询效率越来越慢的情况,因为后期需要遍历的索引块越来越多,并且由于index full scan是单块读,因此后期的效率有可能会比使用ROWNUM的方式更为低下,如下图所示:

65752f06c9e01620144e613cc96a1152.png

SQL: select * from emp order by id OFFSET &1 ROWS FETCH NEXT &2 ROWS ONLY;

执行计划信息:

388aa1a6f7344fc96b918773ff116e57.png

f6525d52ea4346709e1a05d440f20d7f.png

从执行计划可以看出,offset-fetch机制在底层本质上还是基于分析函数实现的,同样使用了索引全扫描(即索引遍历)来避免排序,因此该方法也会出现在分页后期查询效率越来越慢的情况,因为后期需要遍历的索引块越来越多,并且由于index full scan是单块读,从而产生的物理IO和逻辑IO次数更多,因此后期的效率有可能会比使用ROWNUM的方式更为低下,如下图所示: 

c381a6bd58796d671efbf32ad8f638c4.png

8.排序列的选择

当列可为NULL时,Oracle不能使用该列上的索引来避免排序,因为Oracle的索引是不记录NULL值的,如下图所示:

77764ee7f1e8bae9830efd2209347b8d.png

306b7409e5df37fe7688533197636fff.png

通过对比分析,我们可以得出如下结论:

1.当主键值或者非空唯一性列值是连续时,推荐使用主键值或者非空唯一性列进行分页,此时分页效率较高且数据量较大时分页后期性能不会越来越差。

2.当对分页后每页的数据行数没有较高要求时,同样推荐使用主键值或者非空唯一性列进行分页。

3.使用分析函数和OFFSET-FETCH实现分页,分页后期的性能衰减率可能会比通过ROWNUM的方式高,这是因为index full scan是单块读,从而产生了更多次的物理IO和逻辑IO。

4.在使用分析函数和OFFSET-FETCH机制时,需要基于主键或非空唯一性列进行order by排序,此时会通过列上的索引来避免排序操作。若选择的排序列可为NULL,则Oracle数据库只能通过全表扫描来访问数据,因为Oracle数据库的索引是不记录NULL值的,因此不能基于该列上的索引来避免排序,从而保证不会丢失数据。

5.在MySQL中,索引是会记录NULL值的,这也是为什么MySQL中IS NULL可以走索引的原因。

6.MySQL数据库的分页中,可以使用可为null的非唯一性列作为排序列,因为此时MySQL会将null值当作最小值参加排序,不会丢失数据。

作者介绍:

吴海存,10g/11g/12c OCM, Oracle Exadata/Golden Gate 专家, 曾于Amazon和Oracle公司担任全球业务资深DBA,目前供职于中国农业银行,担任资深数据库专家。

f73dea9ec2f56c3fa6be7df413ae6ae6.png

更多阅读推荐

  • 蓝色巨人IBM全力奔赴的混合云之旅能顺利吗?

  • 大数据给教育带来怎样的可能?

  • 对话阿里云:开源与自研如何共处?

  • 除了云原生,2021 年还有这八大趋势值得关注

  • 算力至上?四大AI芯片大对决

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值