千万级数据分页实现

最新推荐文章于 2024-09-10 16:41:59 发布

echoHelloWord

最新推荐文章于 2024-09-10 16:41:59 发布

阅读量7.8k

点赞数

分类专栏： php 开发应用文章标签：数据库分页数据海量数据性能

开发应用同时被 2 个专栏收录

170 篇文章 0 订阅

订阅专栏

php

142 篇文章 0 订阅

订阅专栏

海量数据分页，已经无法使用数据库自带的分页机制，比如MySQL 的 Limit ，这会导致严重的性能问题

1．问题的提出
在软件开发中，大数据量的查询是一个常见的问题，经常会遇到对大量数据进行查询的场景。

常见的对大数据量查询的解决方案有以下两种：

（1）、将全部数据先查询到内存中，然后在内存中进行分页，这种方式对内存占用较大，必须限制一次查询的数据量。

（2）、采用存储过程在数据库中进行分页，这种方式对数据库的依赖较大，不同的数据库实现机制不通，并且查询效率不够理想。以上两种方式对用户来说都不够友好。

2．解决思路
通过在待查询的数据库表上增加一个用于查询的自增长字段，然后采用该字段进行分页查询，可以很好地解决这个问题。下面举例说明这种分页查询方案。

（1）、在待查询的表格上增加一个long型的自增长列，取名为“queryId” 主键增长

先按照大小顺序的倒序查出所有的queryId，

语句如下：select queryId from test_table where order by queryId desc

因为只是查询queryId字段，即使表格中的数据量很大，该查询也会很快得到结果。然后将得到的queryId保存在应用服务器的一个数组中。

用户在客户端进行翻页操作时，客户端将待查询的页号作为参数传递给应用服务器，服务器通过页号和queyId数组算出待查询的queyId最大和最小值，然后进行查询。

算出queyId最大和最小值的算法如下,其中page为待查询的页号，pageSize为每页的大小，queryIds为第二步生成的queryId数组：
         int startRow = (page - 1) * pageSize
        int endRow = page * pageSize - 1;
              if (endRow >=queryIds.length)
                {
                    endRow = this.queryIds.length - 1;
                }
         long startId =queryIds[startRow];
         long endId =queryIds[endRow];