大数据量下的分页

原创 2003年05月24日 18:51:00
 

大数据量下的分页

    对于非常大的数据模型而言,分页检索时,每次都加载整个数据源非常浪费。通常的选择是检索页面大小的块区的数据,而非检索所有的数据,然后单步执行当前行。

    本文演示ASP.net的DataGrid和Sql Server 实现大数据量下的分页,为了便于实现演示,数据表采用了Northwind数据库的Orders表(830条记录)。

    如果数据表中有唯一的自增索引,并且这个字段没有出现断号现象。检索页面大小的块区数据就非常简单了。通过简单的Sql语句就可以实现这个功能:

    
select * from orders where orderid between 10248 and 10253

    其中,开始编号为:(CurrentPageIndex - 1) * PageSize  结束编号为:CurrentPageIndex * PageSize

    当然,如果这个字段断号不是很严重,而且允许不是很严格的按照每页条数分页,这样的方法也是可以用的。

    如果这个字段断号,或者需要按照其他条件排序分页,就要复杂些了。首先要获得这个页面需要显示的编号,然后再按照这个编号获得需要的块区数据。根据编号获得块区数据很简单。不过用下面方式获得数据排序并不是按照指定的id列表顺序,这时候还要附加order by 命令。

select * from orders where orderid in (10248,10249,10250,10251,10252,10253) order by orderid desc

    获得这个页面需要显示的编号列表就复杂多了,而且有多种方案:

方案一:维护一个表,这个表记录需要显示的这些编号排序顺序。(这个表可以是临时表,也可以是物理表)。下面演示了利用一个全局临时表。这个全局临时表记录需要显示的编号。注意排序,这里的order by 就是需要显示的排序顺序。

create table ##temptable(
iid int IDENTITY (1, 1) NOT NULL,
mainid int NOT NULL
)

insert ##temptable(mainid) select OrderID from orders order by OrderID desc

select * from ##temptable

drop table ##temptable -- 实际执行时候,删除全部临时表当然不再这里执行。

这个临时表存在,获得指定分页的分块数据就很简单了。看下面代码:

create table ##temptable(iid int IDENTITY (1, 1) NOT NULL,mainid int NOT NULL)
insert ##temptable(mainid) select OrderID from orders order by OrderID desc
declare @PageSize int,@CurrPage int,@strSQL varchar(2000),@IDStr varchar(1000)
select @PageSize = 30
select @CurrPage = 2
select @IDStr = ''
select @IDStr = @IDStr + ltrim(rtrim(str(MainID))) + ',' from ##temptable 
where iid between ((@CurrPage-1)*@PageSize+1) and @CurrPage*@PageSize
if @IDStr <> '' 
begin
 select @IDStr = left(@IDStr,len(@IDStr)-1)
end
select @strSQL = 'select * from orders where OrderID in ('+@IDStr+')  order by OrderID desc '
exec(@strSQL)
drop table ##temptable

注意:实际使用这个方案的时候,还要考虑何时更新这个全局临时表,一般是放到计划任务中,定时更新这个汇总表。

方案二:每次都去查询,每次获得最新的编号顺序。由于这时候不存在这个临时表,书写获得需要显示页面的编号的字符串就需要点技巧,看下面的代码:

declare @PageSize int,@CurrPage int,
@topnum int,@previous int
select @PageSize = 30
select @CurrPage = 2
select @topnum = @CurrPage * @PageSize
select @previous = (@CurrPage - 1) * @PageSize
declare @i int,@IDStr nvarchar(500),@strSQL nvarchar(1000)
select @i = 0
select @strSQL = N''
select @strSQL = @strSQL + N' select top '+str(@topnum)+ ' @i = @i + 1 '
select @strSQL = @strSQL + N',  @IdStr = '
select @strSQL = @strSQL + N'case when @i > '+str(@previous)+' then  @IdStr + ltrim(rtrim(str(OrderID))) + '','' '
select @strSQL = @strSQL + N'else N''''end '
select @strSQL = @strSQL + N'from Orders '
select @strSQL = ltrim(rtrim(@strSQL)) + N' order by OrderID desc '
Select @IdStr = N''
exec sp_executesql @strSQL,N'@i int,@IdStr varchar(500) output',@i,@IdStr output
if len(rtrim(ltrim(@IdStr))) > 0
begin
 select @IdStr = left(@IdStr,len(@IdStr)-1)
end
select @strSQL = 'select * from orders where OrderID in ('+@IDStr+')'
exec(@strSQL)

ASP.net 的 DataGrid 提供了使用这种分区的数据的方法。 DataGrid 通过 AllowCustomPaging 和 VirtualItemCount 属性支持块区操作。如果 AllowCustomPaging 为 true,则 DataGrid 不会根据 CurrentPageIndex 计算数据模型中的起始显示位置。DataGrid 将显示数据模型中的所有数据,而页导航栏将当前位置报告为 (VirtualItemCount+PageSize-1)/PageSize 之 CurrentPageIndex 页。下面的示例说明此功能。

    

 protected void BindDataGrid(int currpage)
 {
  string strConn = "Data Source=(local);Integrated Security=SSPI;database=Northwind";
  // 请确认 机器名/ASPNET 用户可以访问Northwind数据库
  SqlCommand cmd = new SqlCommand();
  SqlConnection conn = new SqlConnection(strConn);
  SqlParameter[]  parms = new SqlParameter[] {
   new SqlParameter("@PageSize",SqlDbType.Int),
   new SqlParameter("@CurrPage",SqlDbType.Int),
   new SqlParameter("@SearchSql",SqlDbType.NVarChar,128),
   new SqlParameter("@Count",SqlDbType.Int),
  };
  parms[0].Value = DataGrid1.PageSize;
  parms[1].Value = (currpage+1); 
  //  数据库的分页算法第一页是1  DataGrid的第一页是0
  parms[2].Value = DBNull.Value;
  parms[3].Direction = ParameterDirection.Output;
  parms[3].Value = DBNull.Value;
  DataSet DS = new DataSet();
  try 
  {
   if (conn.State != ConnectionState.Open) conn.Open();
   cmd.Connection = conn;
   cmd.CommandText = "Selected_Page_List";
   cmd.CommandType = CommandType.StoredProcedure;
   if (parms != null) 
   {
    foreach (SqlParameter parm in parms)
     cmd.Parameters.Add(parm);
   }
   SqlDataAdapter DA = new SqlDataAdapter(cmd);
   DA.Fill(DS);
   int aa = Convert.ToInt32(parms[3].Value.ToString());
   cmd.Parameters.Clear();
   if (currpage == 0)
   {
    DataGrid1.VirtualItemCount = aa;
   }
   DataGrid1.CurrentPageIndex = currpage;
   DataGrid1.DataSource = DS;
   DataGrid1.DataBind();
  }
  catch(Exception ewx)
  {
   conn.Close();
   Response.Write (ewx.Message.ToString());
   Response.End();
  }
 }

    void Page_Load(Object sender, EventArgs E ) {
  if (!IsPostBack) 
  {
   BindDataGrid(0);
   // 第一次打开这个页面,访问分页的第一页
  }
    }

    void MyDataGrid_Page(Object sender, DataGridPageChangedEventArgs e) {
  BindDataGrid(e.NewPageIndex);
    }

如果你有更多数据量的表稍加修改,也可以使用本演示程序。其下是演示代码下载,演示代码使用的是方案二。使用方法看readme.txt文件。

整个演示代码 下载

http://chs.gotdotnet.com/quickstart/aspplus/samples/webforms/ctrlref/webctrl/datagrid/doc_datagrid.aspx#paging
这里演示了利用DataGrid 的这个功能(没有本文中讨论的利用存储过程获得分区数据)。如对DataGrid的这个功能不太熟悉,请先看这里。

我最近碰到大数据量分页的问题,经过跟CSDN网友讨论,觉得比较可行的方案就是上面提到的2种方案,有谁有更好的方案,或者发现问题请Email联系我,thanks

我的Email是: ghj1976@csdn.net

 

 

大数据量下的分页解决方法

三种主流数据库的分页语句: SQL SERVER:        String sql = "select top " + pageSize + "* from XXX where id not ...
  • hustwht
  • hustwht
  • 2016年08月10日 08:30
  • 1970

oracle 大数据量分页查询

(一)分页实现及性能 Oracle的分页查询语句基本上可以按照本文给出的格式来进行套用。 分页查询格式: SELECT * FROM ( SELECT A.*, ROWNUM RN ...
  • minxwy
  • minxwy
  • 2014年03月10日 18:36
  • 1587

mysql大数据量分页查询优化技巧

PS:我们知道mysql使用Limit实现了分页查询,在我们平常的Web开发中常用一些通用的分页查询jar包,比如说有名的中国开发者实现的java Pagehelper(Github地址https:/...
  • u011687186
  • u011687186
  • 2017年04月17日 16:23
  • 1284

【Oracle】——大数据下分页方法

最近工作非常的轻松,只是做了一些小功能oracle显示分页,但是要求随着数据量的加大,不能影响系统的查询速度,这也就是要求小编在所有的解决方案中选择最好的一项。 小编先提供两种常用的分页方法 方法一、...
  • jiadajing267
  • jiadajing267
  • 2017年03月17日 13:32
  • 1010

mysql数据库大数据量的查询优化和分页测试

http://blog.sina.com.cn/s/blog_438308750100im0b.html 有什么问题:yubaojian0616@163.com 于堡舰   我原来的...
  • u014386474
  • u014386474
  • 2016年07月01日 17:08
  • 4643

【转】大数据量分页查询方法

本文旨在介绍一种对数据库中的大数据量表格进行分页查询的实现方法,该方法对应用服务器、数据库服务器、查询客户端的cpu和内存占用都较低,查询速度较快,是一个较为理想的分页查询实现方案。  1.问题的...
  • shcqupc
  • shcqupc
  • 2016年03月10日 12:55
  • 266

大数据量实时统计排序分页查询 优化总结

大数据量实时统计排序分页查询 (并发数较小时)  的瓶颈不是函数(count,sum等)执行, 不是having, 也不是order by,甚至不是表join, 导致慢的原因就在于“数据量太大本身...
  • mawenshu316143866
  • mawenshu316143866
  • 2017年06月22日 11:13
  • 602

java操作mongodb(分页优化)

前面我们提到过,大数据量分页时,skip如果跳过大量的数据会很慢,这里针对这一情况,我们优化一下分页。 看代码: /** * 大数据量数据分页优化 * @param page * @par...
  • maosijunzi
  • maosijunzi
  • 2014年12月23日 12:08
  • 10141

Sybase 大数据量(100W条)分页 jdbc实现目前要求无排序

Reference:
  • s464036801
  • s464036801
  • 2014年05月27日 16:11
  • 957

ASP.net大数据量下的分页

对于非常大的数据模型而言,分页检索时,每次都加载整个数据源非常浪费。通常的选择是检索页面大小的块区的数据,而非检索所有的数据,然后单步执行当前行。   本文演示ASP.net的DataGrid和Sq...
  • benjiao878
  • benjiao878
  • 2014年04月26日 09:36
  • 211
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:大数据量下的分页
举报原因:
原因补充:

(最多只允许输入30个字)