几种分页算法。翻页必备

经典的:
参考这里:海量数据库的查询优化及分页算法方案 http://dev.csdn.net/article/43/43936.shtm


1.“俄罗斯存储过程”的改良版

CREATE   procedure  pagination1

(@pagesize 
int ,   -- 页面大小,如每页存储20条记录

@pageindex 
int     -- 当前页码

)

as

set  nocount  on

begin

declare  @indextable  table (id  int   identity ( 1 , 1 ),nid  int )   -- 定义表变量

declare  @PageLowerBound  int    -- 定义此页的底码

declare  @PageUpperBound  int    -- 定义此页的顶码

set  @PageLowerBound = (@pageindex - 1 ) * @pagesize

set  @PageUpperBound = @PageLowerBound + @pagesize

set   rowcount  @PageUpperBound

insert   into  @indextable(nid)  select  gid  from  TGongwen  where  fariqi  > dateadd ( day , - 365 , getdate ())  order   by  fariqi  desc

select  O.gid,O.mid,O.title,O.fadanwei,O.fariqi  from  TGongwen O,@indextable t  where  O.gid = t.nid

and  t.id > @PageLowerBound  and  t.id <= @PageUpperBound  order   by  t.id

end

set  nocount  off

文章中的点评:

以上存储过程运用了SQL SERVER的最新技术――表变量。应该说这个存储过程也是一个非常优秀的分页存储过程。当然,在这个过程中,您也可以把其中的表变量写成临时表:CREATE TABLE #Temp。但很明显,在SQL SERVER中,用临时表是没有用表变量快的。所以笔者刚开始使用这个存储过程时,感觉非常的不错,速度也比原来的ADO的好。但后来,我又发现了比此方法更好的方法。

我的感觉:

没有做过测试,从感觉上讲,效率不是太高。



2. not in 的方法:

从publish 表中取出第 n 条到第 m 条的记录:
SELECT   TOP  m - n + 1   *
FROM  publish
WHERE  (id  NOT   IN
    (
SELECT   TOP  n - 1  id
     
FROM  publish))

id 为publish 表的关键字

文章中的点评:

我当时看到这篇文章的时候,真的是精神为之一振,觉得思路非常得好。等到后来,我在作办公自动化系统(ASP.NET+ C#+SQL SERVER)的时候,忽然想起了这篇文章,我想如果把这个语句改造一下,这就可能是一个非常好的分页存储过程。于是我就满网上找这篇文章,没想到,文章还没找到,却找到了一篇根据此语句写的一个分页存储过程,这个存储过程也是目前较为流行的一种分页存储过程,我很后悔没有争先把这段文字改造成存储过程:
(更多的内容,请查看原文。)

我的感觉:

使用了 not in  而 not in  是无法使用索引的,所以从效率上讲还是差了一点。


2. max 的方法:

 

select   top  页大小  *

from  table1

where  id >

     (
select   max  (id)  from

     (
select   top  ((页码 - 1 ) * 页大小) id  from  table1  order   by  id)  as  T

      )    

 
order   by  id

文章中的点评:

我们知道,几乎任何字段,我们都可以通过max(字段)或min(字段)来提取某个字段中的最大或最小值,所以如果这个字段不重复,那么就可以利用这些不重复的字段的max或min作为分水岭,使其成为分页算法中分开每页的参照物。在这里,我们可以用操作符“>”或“<”号来完成这个使命,使查询语句符合SARG形式。如:

Select top 10 * from table1 where id>200

我的感觉:

这个就高高效了一点。但是不清楚 max的工作原理,不知道它的性能如何。


下面的才是重点 —— 我研究的算法。如有雷同,属于英雄所见略同!

1、追求高效的翻页算法 —— 定位法。

 

declare  @pageSize  int     -- 返回一页的记录数
declare  @CurPage  int    -- 页号(第几页)0:第一页;-1最后一页。

declare  @Count  int
declare  @id  int

set  @pageSize = 10
set  @CurPage  = 1

-- 定位
if  @CurPage  =   - 1
begin
 
-- 最后一页
  set   rowcount  @pageSize
 
select  @id = newsID  from  newsTemp    order   by  newsID
end

if  @CurPage  >   0
begin
 
set  @Count  =  @pageSize  *  (@CurPage  - 1 +   1
 
set   rowcount  @Count
 
select  @id = newsID  from  newsTemp    order   by  newsID  desc
end

-- 返回记录
set   rowcount  @pageSize
select   *   from  newsTemp  where  newsID  <= @id  order   by  newsID  desc

set   rowcount   0

思路:就是上面的算法的延续,就是说呢避免使用  not in 和 max 的方法。

也就是这个思路:Select top 10 * from table1 where id>200

定位 —— 就是说要找到“临界点”,分页的临界点。找到了之后剩下的事情就好办了。

缺点:单字段排序、排序字段的值不能重复(不是绝对不能重复,可以有少量的重复)。


2、通用法 —— 颠颠倒倒法

有的时候“定位法”的缺点是不可以接受的,但是没有关系,可以用这个的。

 

select   *   from   table   where  id  in  
(
 
select   top   10  ID  from  
 (
  
select   top   20  ID,addedDate  from   table  
  
order   by  addedDate  desc
 ) 
as  aa  order   by  addedDate
)
order   by  addedDate  desc

ID 是主键,addedDate 是排序字段。

缺点:必须有主键。



Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=553609

<script src="/PromoteIcon.aspx?Id=553609" type="text/javascript"> </script>[ 推荐本文] [ 点击此处收藏本文]   发表于 2005年12月16日 8:50 AM
href="http://blog.csdn.net/mabaocheng/Services/Pingback.aspx" rel="pingback"/>
style="BORDER-RIGHT: medium none; PADDING-RIGHT: 0px; BORDER-TOP: medium none; PADDING-LEFT: 0px; PADDING-BOTTOM: 0px; MARGIN: 0px; BORDER-LEFT: medium none; WIDTH: 156px; PADDING-TOP: 0px; BORDER-BOTTOM: medium none; HEIGHT: 22px" src="http://blog.csdn.net/search_iframe.html" frameborder="0" scrolling="no">
<script type="text/javascript"> document.write("<img src=http://counter.csdn.net/pv.aspx?id=24 border=0 width=0 height=0>"); </script>

 
路过 发表于2005-12-18 2:56 PM  IP: 61.144.214.*
不通用,效率一般

 
拖出去痛扁 发表于2005-12-18 7:41 PM  IP: 220.160.175.*
只局限在SQL Server

 
24 发表于2005-12-19 8:43 AM  IP: 219.137.36.*
没啥意义

 
yeafee 发表于2005-12-19 9:09 AM  IP: 202.103.42.*
还好呀,大家都太对别人苛刻了,为什么不多一些鼓励呢?高手写文章都是给后来人看的,别的高手会看?

 
znforce 发表于2005-12-19 9:37 AM  IP: 221.218.195.*
中国人 就会 评论 说不好的 你牛逼 你上去 写个 好的

写不出来的 就 别说人家写的不好

 
关门放狗 发表于2005-12-19 10:04 AM  IP: 61.232.0.*
TOP后面能带变量?
还有除了第一种方法外,其他几种方法我看着都想吐~
你到底了不了解SQL啊?
是先给条件后取结果快,还是靠条件取出大部分,然后再从中取出你想要的那部分快?
没做过测试就敢妄然评论?

是SqlServer对Where做了优化还是对SELECT TOP做了优化?

 
jadedrip 发表于2005-12-19 10:06 AM  IP: 60.186.82.*
oracle 有 rowid, sql Server 也应该有类似的内置字段吧?


oracle 里:
select * from xxx where rowid in ((page-1) *20, page * 20);

这样就应该能完成分页了。

 
关门放狗 发表于2005-12-19 10:14 AM  IP: 61.232.0.*
To znforce:
能吃的不一定都可以吃
比如 Shit

不能否认楼主的功劳,但是楼主也不要不负责任di妄然评价上面的分页方法,在我看来,除了第一条,其他都是旁门左道,性能测试关就过不去。
为什么楼主不试一试测试?
在存储过程起始设置
DECLARE @BeginTime datetime
SET @BeginTime=GETDATE()

在存储过程尾设置
SELECT GETDATE()-@BeginTime


 
游荡的灵魂 发表于2005-12-19 12:59 PM  IP: 222.210.200.*
你的那个方法,我也在用,我是看了梁哲锋文章后,得到的方法!


 
54powerman 发表于2005-12-19 1:18 PM  IP: 202.108.91.*
不管怎样,整理的不错,能够拿出数字就更好了。

 
znforce 发表于2005-12-19 2:26 PM  IP: 221.218.195.*
to 关门放狗

能吃的 是 不一定都可以吃
但 总比你 不知道 吃什么强吧

比如 Shit 难道你们家 认为 Shit属于 能吃的 东西吗

能 拿出 例子 分享 就已经不错了 大家看了 可以从上面 学习到 别人的 一些好的 方法

 
longaway 发表于2005-12-19 6:20 PM  IP: 221.219.195.*

也是一种方案咯。

共享的心肯定是好的。

 
Jemmy 发表于2005-12-19 7:08 PM  IP: 207.46.50.*
SQL Server 2005 支持TOP后跟变量
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值