几种分页算法。翻页必备

最新推荐文章于 2022-11-12 15:20:20 发布

qdzx2008

最新推荐文章于 2022-11-12 15:20:20 发布

阅读量1.4k

点赞数

分类专栏：数据库文章标签：算法 sql server 存储 table sqlserver 测试

数据库专栏收录该内容

12 篇文章 0 订阅

订阅专栏

经典的：
参考这里：海量数据库的查询优化及分页算法方案 http://dev.csdn.net/article/43/43936.shtm

1.“俄罗斯存储过程”的改良版

CREATE procedure pagination1

(@pagesize int , -- 页面大小，如每页存储20条记录

@pageindex int -- 当前页码

)

set nocount on

begin

declare @indextable table (id int identity ( 1 , 1 ),nid int ) -- 定义表变量

declare @PageLowerBound int -- 定义此页的底码

declare @PageUpperBound int -- 定义此页的顶码

set @PageLowerBound = (@pageindex - 1 ) * @pagesize

set @PageUpperBound = @PageLowerBound + @pagesize

set rowcount @PageUpperBound

insert into @indextable(nid) select gid from TGongwen where fariqi > dateadd ( day , - 365 , getdate ()) order by fariqi desc

select O.gid,O.mid,O.title,O.fadanwei,O.fariqi from TGongwen O,@indextable t where O.gid = t.nid

and t.id > @PageLowerBound and t.id <= @PageUpperBound order by t.id

end

set nocount off

文章中的点评：

以上存储过程运用了SQL SERVER的最新技术――表变量。应该说这个存储过程也是一个非常优秀的分页存储过程。当然，在这个过程中，您也可以把其中的表变量写成临时表：CREATE TABLE #Temp。但很明显，在SQL SERVER中，用临时表是没有用表变量快的。所以笔者刚开始使用这个存储过程时，感觉非常的不错，速度也比原来的ADO的好。但后来，我又发现了比此方法更好的方法。

我的感觉：

没有做过测试，从感觉上讲，效率不是太高。

2. not in 的方法：

从publish 表中取出第 n 条到第 m 条的记录：

SELECT TOP m - n + 1 *

FROM publish

WHERE (id NOT IN

　　　　( SELECT TOP n - 1 id

　　　　 FROM publish))

id 为publish 表的关键字

文章中的点评：

我当时看到这篇文章的时候，真的是精神为之一振，觉得思路非常得好。等到后来，我在作办公自动化系统（ASP.NET+ C#＋SQL SERVER）的时候，忽然想起了这篇文章，我想如果把这个语句改造一下，这就可能是一个非常好的分页存储过程。于是我就满网上找这篇文章，没想到，文章还没找到，却找到了一篇根据此语句写的一个分页存储过程，这个存储过程也是目前较为流行的一种分页存储过程，我很后悔没有争先把这段文字改造成存储过程：
（更多的内容，请查看原文。）

我的感觉：

使用了 not in 而 not in 是无法使用索引的，所以从效率上讲还是差了一点。

2. max 的方法：

select top 页大小 *

from table1

where id >

( select max (id) from

( select top ((页码 - 1 ) * 页大小) id from table1 order by id) as T

)

order by id

文章中的点评：

我们知道，几乎任何字段，我们都可以通过max(字段)或min(字段)来提取某个字段中的最大或最小值，所以如果这个字段不重复，那么就可以利用这些不重复的字段的max或min作为分水岭，使其成为分页算法中分开每页的参照物。在这里，我们可以用操作符“>”或“<”号来完成这个使命，使查询语句符合SARG形式。如：

Select top 10 * from table1 where id>200

我的感觉：

这个就高高效了一点。但是不清楚 max的工作原理，不知道它的性能如何。

下面的才是重点 —— 我研究的算法。如有雷同，属于英雄所见略同！

1、追求高效的翻页算法 —— 定位法。

declare @pageSize int -- 返回一页的记录数

declare @CurPage int -- 页号（第几页）0：第一页；-1最后一页。

declare @Count int

declare @id int

set @pageSize = 10

set @CurPage = 1

-- 定位

if @CurPage = - 1

begin

-- 最后一页

set rowcount @pageSize

select @id = newsID from newsTemp order by newsID

end

if @CurPage > 0

begin

set @Count = @pageSize * (@CurPage - 1 ) + 1

set rowcount @Count

select @id = newsID from newsTemp order by newsID desc

end

-- 返回记录

set rowcount @pageSize

select * from newsTemp where newsID <= @id order by newsID desc

set rowcount 0

思路：就是上面的算法的延续，就是说呢避免使用 not in 和 max 的方法。

也就是这个思路：Select top 10 * from table1 where id>200

定位 —— 就是说要找到“临界点”，分页的临界点。找到了之后剩下的事情就好办了。

缺点：单字段排序、排序字段的值不能重复（不是绝对不能重复，可以有少量的重复）。

2、通用法 —— 颠颠倒倒法

有的时候“定位法”的缺点是不可以接受的，但是没有关系，可以用这个的。

select * from table where id in

(

select top 10 ID from

(

select top 20 ID,addedDate from table

order by addedDate desc

) as aa order by addedDate

)

order by addedDate desc

ID 是主键，addedDate 是排序字段。

缺点：必须有主键。

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=553609

href="http://blog.csdn.net/mabaocheng/Services/Pingback.aspx" rel="pingback"/>

style="BORDER-RIGHT: medium none; PADDING-RIGHT: 0px; BORDER-TOP: medium none; PADDING-LEFT: 0px; PADDING-BOTTOM: 0px; MARGIN: 0px; BORDER-LEFT: medium none; WIDTH: 156px; PADDING-TOP: 0px; BORDER-BOTTOM: medium none; HEIGHT: 22px" src="http://blog.csdn.net/search_iframe.html" frameborder="0" scrolling="no">

路过发表于2005-12-18 2:56 PM IP: 61.144.214.*

不通用，效率一般

拖出去痛扁发表于2005-12-18 7:41 PM IP: 220.160.175.*

只局限在SQL Server

24 发表于2005-12-19 8:43 AM IP: 219.137.36.*

没啥意义

yeafee 发表于2005-12-19 9:09 AM IP: 202.103.42.*

还好呀,大家都太对别人苛刻了,为什么不多一些鼓励呢?高手写文章都是给后来人看的,别的高手会看?

znforce 发表于2005-12-19 9:37 AM IP: 221.218.195.*

中国人就会评论说不好的你牛逼你上去写个好的

写不出来的就别说人家写的不好

关门放狗发表于2005-12-19 10:04 AM IP: 61.232.0.*

TOP后面能带变量？
还有除了第一种方法外，其他几种方法我看着都想吐~
你到底了不了解SQL啊？
是先给条件后取结果快，还是靠条件取出大部分，然后再从中取出你想要的那部分快？
没做过测试就敢妄然评论？

是SqlServer对Where做了优化还是对SELECT TOP做了优化？

jadedrip 发表于2005-12-19 10:06 AM IP: 60.186.82.*

oracle 有 rowid, sql Server 也应该有类似的内置字段吧？

oracle 里：
select * from xxx where rowid in ((page-1) *20, page * 20);

这样就应该能完成分页了。

关门放狗发表于2005-12-19 10:14 AM IP: 61.232.0.*

To znforce:
能吃的不一定都可以吃
比如 Shit

不能否认楼主的功劳，但是楼主也不要不负责任di妄然评价上面的分页方法，在我看来，除了第一条，其他都是旁门左道，性能测试关就过不去。
为什么楼主不试一试测试？
在存储过程起始设置
DECLARE @BeginTime datetime
SET @BeginTime=GETDATE()

在存储过程尾设置
SELECT GETDATE()-@BeginTime

游荡的灵魂发表于2005-12-19 12:59 PM IP: 222.210.200.*

你的那个方法，我也在用，我是看了梁哲锋文章后，得到的方法！

54powerman 发表于2005-12-19 1:18 PM IP: 202.108.91.*

不管怎样，整理的不错，能够拿出数字就更好了。

znforce 发表于2005-12-19 2:26 PM IP: 221.218.195.*

to 关门放狗

能吃的是不一定都可以吃
但总比你不知道吃什么强吧

比如 Shit 难道你们家认为 Shit属于能吃的东西吗

能拿出例子分享就已经不错了大家看了可以从上面学习到别人的一些好的方法

longaway 发表于2005-12-19 6:20 PM IP: 221.219.195.*

也是一种方案咯。

共享的心肯定是好的。

Jemmy 发表于2005-12-19 7:08 PM IP: 207.46.50.*

SQL Server 2005 支持TOP后跟变量