大数据量分页存储过程效率测试附代码

在项目中,我们经常遇到或用到分页,那么在大数据量(百万级以上)下,哪种分页算法效率最优呢?我们不妨用事实说话。

 

测试环境

硬件:CPU 酷睿双核T5750  内存:2G

软件:Windows server 2003    +   Sql server 2005

 

OK,我们首先创建一数据库:data_Test,并在此数据库中创建一表:tb_TestTable

  1. create database data_Test  --创建数据库data_Test
  2. GO
  3. use data_Test
  4. GO
  5. create table tb_TestTable   --创建表
  6. (
  7.     id int identity(1,1) primary key,
  8.     userName nvarchar(20) not null,
  9.     userPWD nvarchar(20) not null,
  10.     userEmail nvarchar(40) null
  11. )
  12. GO

然后我们在数据表中插入2000000条数据:

  1. --插入数据
  2. set identity_insert tb_TestTable on
  3. declare @count int
  4. set @count=1
  5. while @count<=2000000
  6. begin 
  7.     insert into tb_TestTable(id,userName,userPWD,userEmail) values(@count,'admin','admin888','lli0077@yahoo.com.cn')
  8.     set @count=@count+1
  9. end
  10. set identity_insert tb_TestTable off

我首先写了五个常用存储过程:

1,利用select top 和select not in进行分页,具体代码如下:

  1. create procedure proc_paged_with_notin  --利用select top and select not in
  2. (
  3.     @pageIndex int,  --页索引
  4.     @pageSize int    --每页记录数
  5. )
  6. as
  7. begin
  8.     set nocount on;
  9.     declare @timediff datetime --耗时
  10.     declare @sql nvarchar(500)
  11.     select @timediff=Getdate()
  12.     set @sql='select top '+str(@pageSize)+' * from tb_TestTable where(ID not in(select top '+str(@pageSize*@pageIndex)+' id from tb_TestTable order by ID ASC)) order by ID'
  13.     execute(@sql)  --因select top后不支技直接接参数,所以写成了字符串@sql
  14.     select datediff(ms,@timediff,GetDate()) as 耗时
  15.     set nocount off;
  16. end

2,利用select top 和 select max(列键)

  1. create procedure proc_paged_with_selectMax  --利用select top and select max(列)
  2. (
  3.     @pageIndex int,  --页索引
  4.     @pageSize int    --页记录数
  5. )
  6. as
  7. begin
  8. set nocount on;
  9.     declare @timediff datetime
  10.     declare @sql nvarchar(500)
  11.     select @timediff=Getdate()
  12.     set @sql='select top '+str(@pageSize)+' * From tb_TestTable where(ID>(select max(id) From (select top '+str(@pageSize*@pageIndex)+' id From tb_TestTable order by ID) as TempTable)) order by ID'
  13.     execute(@sql)
  14.     select datediff(ms,@timediff,GetDate()) as 耗时
  15. set nocount off;
  16. end

 

3,利用select top和中间变量--此方法因网上有人说效果最佳,所以贴出来一同测试

  1. create procedure proc_paged_with_Midvar  --利用ID>最大ID值和中间变量
  2. (
  3.     @pageIndex int,
  4.     @pageSize int
  5. )
  6. as
  7.     declare @count int
  8.     declare @ID int
  9.     declare @timediff datetime
  10.     declare @sql nvarchar(500)
  11. begin
  12. set nocount on;
  13.     select @count=0,@ID=0,@timediff=getdate()
  14.     select @count=@count+1,@ID=case when @count<=@pageSize*@pageIndex then ID else @ID end from tb_testTable order by id
  15.     set @sql='select top '+str(@pageSize)+' * from tb_testTable where ID>'+str(@ID)
  16.     execute(@sql)
  17.     select datediff(ms,@timediff,getdate()) as 耗时
  18. set nocount off;
  19. end

 

4,利用Row_number() 此方法为SQL server 2005中新的方法,利用Row_number()给数据行加上索引

  1. create procedure proc_paged_with_Rownumber  --利用SQL 2005中的Row_number()
  2. (
  3.     @pageIndex int,
  4.     @pageSize int
  5. )
  6. as
  7.     declare @timediff datetime
  8. begin
  9. set nocount on;
  10.     select @timediff=getdate()
  11.     select * from (select *,Row_number() over(order by ID asc) as IDRank from tb_testTable) as IDWithRowNumber where IDRank>@pageSize*@pageIndex and IDRank<@pageSize*(@pageIndex+1)
  12.     select datediff(ms,@timediff,getdate()) as 耗时
  13. set nocount off;
  14. end

5,利用临时表及Row_number

  1. create procedure proc_CTE  --利用临时表及Row_number
  2. (
  3.     @pageIndex int,  --页索引
  4.     @pageSize int    --页记录数
  5. )
  6. as
  7.     set nocount on;
  8.     declare @ctestr nvarchar(400)
  9.     declare @strSql nvarchar(400)
  10.     declare @datediff datetime
  11. begin
  12.     select @datediff=GetDate()
  13.     set @ctestr='with Table_CTE as
  14.                 (select ceiling((Row_number() over(order by ID ASC))/'+str(@pageSize)+'as page_num,* from tb_TestTable)';
  15.     set @strSql=@ctestr+' select * From Table_CTE where page_num='+str(@pageIndex)
  16. end
  17.     begin
  18.         execute sp_executesql @strSql
  19.         select datediff(ms,@datediff,GetDate())
  20.     set nocount off;
  21.     end

 

OK,至此,存储过程创建完毕,我们分别在每页10条数据的情况下在第2页,第1000页,第10000页,第100000页,第199999页进行测试,耗时单位:ms  每页测试5次取其平均值

存过第2页耗时第1000页耗时第10000页耗时第100000页耗时第199999页耗时效率排行
1用not in0ms16ms47ms475ms953ms3
2用select max5ms16ms35ms325ms623ms1
3中间变量966ms970ms960ms945ms933ms5
4row_number0ms0ms34ms365ms710ms2
4临时表780ms796ms798ms780ms805ms4

 

测试结果显示:select max >row_number>not in>临时表>中间变量

 

于是我对效率最高的select max方法用2分法进行了扩展,代码取自互联网,我修改了ASC排序时取不到值的BUG,测试结果:

2分法156ms156ms180ms470ms156ms1*

 

从测试结果来看,使用2分法确实可以提高效率并使效率更为稳定,我又增加了第159999页的测试,用时仅296ms,效果相当的不错!

 

下面是2分法使用select max的代码,已相当完善。

  1. --/*-----存储过程 分页处理 孙伟 2005-03-28创建 -------*/
  2. --/*-----存储过程 分页处理 浪尘 2008-9-1修改----------*/
  3. --/*----- 对数据进行了2分处理使查询前半部分数据与查询后半部分数据性能相同 -------*/
  4. --/*-----存储过程 分页处理 孙伟 2005-12-13修改 修改数据分页方式为top max模式 性能有极大提高-------*/
  5. --/*-----缺点:相对之前的not in版本主键只能是整型字段,如主键为GUID类型请使用not in 模式的版本-------*/
  6. alter PROCEDURE proc_paged_2part_selectMax
  7. (
  8. @tblName     nvarchar(200),        ----要显示的表或多个表的连接
  9. @fldName     nvarchar(500) = '*',    ----要显示的字段列表
  10. @pageSize    int = 10,        ----每页显示的记录个数
  11. @page        int = 1,        ----要显示那一页的记录
  12. @fldSort    nvarchar(200) = null,    ----排序字段列表或条件
  13. @Sort        bit = 0,        ----排序方法,0为升序,1为降序(如果是多字段排列Sort指代最后一个排序字段的排列顺序(最后一个排序字段不加排序标记)--程序传参如:' SortA Asc,SortB Desc,SortC ')
  14. @strCondition    nvarchar(1000) = null,    ----查询条件,不需where
  15. @ID        nvarchar(150),        ----主表的主键
  16. @Dist                 bit = 0,           ----是否添加查询字段的 DISTINCT 默认0不添加/1添加
  17. @pageCount    int = 1 output,            ----查询结果分页后的总页数
  18. @Counts    int = 1 output                ----查询到的记录数
  19. )
  20. AS
  21. SET NOCOUNT ON
  22. Declare @sqlTmp nvarchar(1000)        ----存放动态生成的SQL语句
  23. Declare @strTmp nvarchar(1000)        ----存放取得查询结果总数的查询语句
  24. Declare @strID     nvarchar(1000)        ----存放取得查询开头或结尾ID的查询语句
  25. Declare @strSortType nvarchar(10)    ----数据排序规则A
  26. Declare @strFSortType nvarchar(10)    ----数据排序规则B
  27. Declare @SqlSelect nvarchar(50)         ----对含有DISTINCT的查询进行SQL构造
  28. Declare @SqlCounts nvarchar(50)          ----对含有DISTINCT的总数查询进行SQL构造
  29. declare @timediff datetime  --耗时测试时间差
  30. select @timediff=getdate()
  31. if @Dist  = 0
  32. begin
  33.     set @SqlSelect = 'select '
  34.     set @SqlCounts = 'Count(*)'
  35. end
  36. else
  37. begin
  38.     set @SqlSelect = 'select distinct '
  39.     set @SqlCounts = 'Count(DISTINCT '+@ID+')'
  40. end
  41. if @Sort=0
  42. begin
  43.     set @strFSortType=' ASC '
  44.     set @strSortType=' DESC '
  45. end
  46. else
  47. begin
  48.     set @strFSortType=' DESC '
  49.     set @strSortType=' ASC '
  50. end
  51. --------生成查询语句--------
  52. --此处@strTmp为取得查询结果数量的语句
  53. if @strCondition is null or @strCondition=''     --没有设置显示条件
  54. begin
  55.     set @sqlTmp =  @fldName + ' From ' + @tblName
  56.     set @strTmp = @SqlSelect+' @Counts='+@SqlCounts+' FROM '+@tblName
  57.     set @strID = ' From ' + @tblName
  58. end
  59. else
  60. begin
  61.     set @sqlTmp = + @fldName + 'From ' + @tblName + ' where (1>0) ' + @strCondition
  62.     set @strTmp = @SqlSelect+' @Counts='+@SqlCounts+' FROM '+@tblName + ' where (1>0) ' + @strCondition
  63.     set @strID = ' From ' + @tblName + ' where (1>0) ' + @strCondition
  64. end
  65. ----取得查询结果总数量-----
  66. exec sp_executesql @strTmp,N'@Counts int out ',@Counts out
  67. declare @tmpCounts int
  68. if @Counts = 0
  69.     set @tmpCounts = 1
  70. else
  71.     set @tmpCounts = @Counts
  72.     --取得分页总数
  73.     set @pageCount=(@tmpCounts+@pageSize-1)/@pageSize
  74.     /**//**当前页大于总页数 取最后一页**/
  75.     if @page>@pageCount
  76.         set @page=@pageCount
  77.     --/*-----数据分页2分处理-------*/
  78.     declare @pageIndex int --总数/页大小
  79.     declare @lastcount int --总数%页大小 
  80.     set @pageIndex = @tmpCounts/@pageSize
  81.     set @lastcount = @tmpCounts%@pageSize
  82.     if @lastcount > 0
  83.         set @pageIndex = @pageIndex + 1
  84.     else
  85.         set @lastcount = @pagesize
  86.     --//***显示分页
  87.     if @strCondition is null or @strCondition=''     --没有设置显示条件
  88.     begin
  89.         if @pageIndex<2 or @page<=@pageIndex / 2 + @pageIndex % 2   --前半部分数据处理
  90.             begin 
  91.                 if @page=1
  92.                     set @strTmp=@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName                        
  93.                         +' order by '+ @fldSort +' '+ @strFSortType
  94.                 else
  95.                 begin
  96.                     if @Sort=1
  97.                     begin                    
  98.                     set @strTmp=@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  99.                         +' where '+@ID+' <(select min('+ @ID +') from ('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-1) as Varchar(20)) +' '+ @ID +' from '+@tblName
  100.                         +' order by '+ @fldSort +' '+ @strFSortType+') AS TBMinID)'
  101.                         +' order by '+ @fldSort +' '+ @strFSortType
  102.                     end
  103.                     else
  104.                     begin
  105.                     set @strTmp=@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  106.                         +' where '+@ID+' >(select max('+ @ID +') from ('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-1) as Varchar(20)) +' '+ @ID +' from '+@tblName
  107.                         +' order by '+ @fldSort +' '+ @strFSortType+') AS TBMinID)'
  108.                         +' order by '+ @fldSort +' '+ @strFSortType 
  109.                     end
  110.                 end    
  111.             end
  112.         else
  113.             begin
  114.             set @page = @pageIndex-@page+1 --后半部分数据处理
  115.                 if @page <= 1 --最后一页数据显示                
  116.                     set @strTmp=@SqlSelect+' * from ('+@SqlSelect+' top '+ CAST(@lastcount as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  117.                         +' order by '+ @fldSort +' '+ @strSortType+') AS TempTB'+' order by '+ @fldSort +' '+ @strFSortType 
  118.                 else
  119.                     if @Sort=1
  120.                     begin
  121.                     set @strTmp=@SqlSelect+' * from ('+@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  122.                         +' where '+@ID+' >(select max('+ @ID +') from('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-2)+@lastcount as Varchar(20)) +' '+ @ID +' from '+@tblName
  123.                         +' order by '+ @fldSort +' '+ @strSortType+') AS TBMaxID)'
  124.                         +' order by '+ @fldSort +' '+ @strSortType+') AS TempTB'+' order by '+ @fldSort +' '+ @strFSortType
  125.                     end
  126.                     else
  127.                     begin
  128.                     set @strTmp=@SqlSelect+' * from ('+@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  129.                         +' where '+@ID+' <(select min('+ @ID +') from('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-2)+@lastcount as Varchar(20)) +' '+ @ID +' from '+@tblName
  130.                         +' order by '+ @fldSort +' '+ @strSortType+') AS TBMaxID)'
  131.                         +' order by '+ @fldSort +' '+ @strSortType+') AS TempTB'+' order by '+ @fldSort +' '+ @strFSortType 
  132.                     end
  133.             end
  134.     end
  135.     else --有查询条件
  136.     begin
  137.         if @pageIndex<2 or @page<=@pageIndex / 2 + @pageIndex % 2   --前半部分数据处理
  138.         begin
  139.                 if @page=1
  140.                     set @strTmp=@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName                        
  141.                         +' where 1=1 ' + @strCondition + ' order by '+ @fldSort +' '+ @strFSortType
  142.                 else if(@Sort=1)
  143.                 begin                    
  144.                     set @strTmp=@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  145.                         +' where '+@ID+' <(select min('+ @ID +') from ('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-1) as Varchar(20)) +' '+ @ID +' from '+@tblName
  146.                         +' where (1=1) ' + @strCondition +' order by '+ @fldSort +' '+ @strFSortType+') AS TBMinID)'
  147.                         +' '+ @strCondition +' order by '+ @fldSort +' '+ @strFSortType
  148.                 end
  149.                 else
  150.                 begin
  151.                     set @strTmp=@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  152.                         +' where '+@ID+' >(select max('+ @ID +') from ('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-1) as Varchar(20)) +' '+ @ID +' from '+@tblName
  153.                         +' where (1=1) ' + @strCondition +' order by '+ @fldSort +' '+ @strFSortType+') AS TBMinID)'
  154.                         +' '+ @strCondition +' order by '+ @fldSort +' '+ @strFSortType 
  155.                 end           
  156.         end
  157.         else
  158.         begin 
  159.             set @page = @pageIndex-@page+1 --后半部分数据处理
  160.             if @page <= 1 --最后一页数据显示
  161.                     set @strTmp=@SqlSelect+' * from ('+@SqlSelect+' top '+ CAST(@lastcount as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  162.                         +' where (1=1) '+ @strCondition +' order by '+ @fldSort +' '+ @strSortType+') AS TempTB'+' order by '+ @fldSort +' '+ @strFSortType                     
  163.             else if(@Sort=1)
  164.                     set @strTmp=@SqlSelect+' * from ('+@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  165.                         +' where '+@ID+' >(select max('+ @ID +') from('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-2)+@lastcount as Varchar(20)) +' '+ @ID +' from '+@tblName
  166.                         +' where (1=1) '+ @strCondition +' order by '+ @fldSort +' '+ @strSortType+') AS TBMaxID)'
  167.                         +' '+ @strCondition+' order by '+ @fldSort +' '+ @strSortType+') AS TempTB'+' order by '+ @fldSort +' '+ @strFSortType    
  168.             else
  169.                     set @strTmp=@SqlSelect+' * from ('+@SqlSelect+' top '+ CAST(@pageSize as VARCHAR(4))+' '+ @fldName+' from '+@tblName
  170.                         +' where '+@ID+' <(select min('+ @ID +') from('+ @SqlSelect+' top '+ CAST(@pageSize*(@page-2)+@lastcount as Varchar(20)) +' '+ @ID +' from '+@tblName
  171.                         +' where (1=1) '+ @strCondition +' order by '+ @fldSort +' '+ @strSortType+') AS TBMaxID)'
  172.                         +' '+ @strCondition+' order by '+ @fldSort +' '+ @strSortType+') AS TempTB'+' order by '+ @fldSort +' '+ @strFSortType            
  173.         end    
  174.     end
  175. ------返回查询结果-----
  176. exec sp_executesql @strTmp
  177. select datediff(ms,@timediff,getdate()) as 耗时
  178. --print @strTmp
  179. SET NOCOUNT OFF
  180. GO

 

执行示例:exec proc_paged_2part_selectMax 'tb_testTable','ID,userName,userPWD,userEmail',10,100000,'ID',0,null,'ID',0

 

这种测试只在单机进行,并且没有在实际开发WEB项目中分页测试,测试项也比较单一,所以不够全面系统,但从其效率相比上,我们可以在数据库分页算法上进行有效的控制。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值