MySQL 深分页解决方案

前言


在MySQL中,深分页(deep pagination)指的是在结果集的末尾进行分页查询,例如查询第 1000 页的数据。这种操作通常会导致性能问题,因为 MySQL 必须扫描和跳过大量行数据来找到所需的
结果。

深分页问题

创建表

CREATE TABLE user (
    id bigint(20) NOT NULL AUTO_INCREMENT,
    name varchar(255) DEFAULT NULL,
    phone varchar(255) DEFAULT NULL,
    create_by varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci DEFAULT NULL,
    remark varchar(255) DEFAULT NULL,
    birthday datetime DEFAULT NULL,
    PRIMARY KEY (id),
    INDEX idx_name (name)
) ENGINE=InnoDB AUTO_INCREMENT=400001 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

添加数据

这里添加了500w条数据到数据库

    @Test
    public void test3(){
        for(int j=0;j<500;j++){
            List<UserEntity> userEntityList = new ArrayList<>();
            for (int i = 0; i < 10000; i++) {  //测试数据
                UserEntity client = new UserEntity();
                client.setName("小明" + String.format("%09d",j*100000+ i));
                client.setPhone("18797" + String.format("%09d",j*100000+ i));
                client.setCeateBy("JueYue"+String.format("%09d",j*100000+ i));
                client.setRemark("测试" + String.format("%09d",j*100000+ i));

                userEntityList.add(client);
            }
            userService.saveBatch(userEntityList);
            System.out.println("插入"+(j+1)+"次");
        }

    }

深分页语句

分别以10w,50w,100w,450w为起点查10条数据

SELECT * FROM user LIMIT 100000,10;
SELECT * FROM user LIMIT 500000,10;
SELECT * FROM user LIMIT 1000000,10;
SELECT * FROM user LIMIT 4500000,10;

可以看到 在偏移量相同的情况下,初始位置越大,耗时越久

优化方案

延迟关联

SELECT * FROM user LIMIT 100000,10;
SELECT user.*FROM user
JOIN (
    SELECT id FROM user LIMIT 100000, 10
) AS subquery ON user.id = subquery.id;

SELECT * FROM user LIMIT 500000,10;
SELECT user.*FROM user
JOIN (
    SELECT id FROM user LIMIT 500000, 10
) AS subquery ON user.id = subquery.id;

SELECT * FROM user LIMIT 1000000,10;
SELECT user.*FROM user
JOIN (
    SELECT id FROM user LIMIT 1000000, 10
) AS subquery ON user.id = subquery.id;

SELECT * FROM user LIMIT 4500000,10;
SELECT user.*FROM user
JOIN (
    SELECT id FROM user LIMIT 4500000, 10
) AS subquery ON user.id = subquery.id;

可以看到使用延迟关联的性能是要优于直接查询,这是因为当偏移量很大时(如4500000),MySQL必须扫描并跳过前4500000条记录,这会消耗大量的I/O和计算资源。而优化后的方法只会加载 id 列的值,又因为 id 是有索引的,它可以快速的帮我们定位到 id 对应列的全部数据,但是如果 id 列没有建立索引,那么他就会全表扫描,效率也是非常低的。

覆盖索引和主键优化

SELECT * FROM user LIMIT 4500000,10;
SELECT * 
FROM user 
WHERE id > (SELECT id FROM user ORDER BY id LIMIT 4500000, 1) 
ORDER BY id 
LIMIT 10;

这里通过子查询先获取分页起点的 id 值,然后再进行主查询。这种方式有效减少了跳过的记录数。

  • 24
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL分页问题指的是在查询大量数据时,需要获取结果集中某一页的数据,而这个页数非常靠后,会导致查询性能下降和资源消耗过大的情况。 解决MySQL分页问题可以尝试以下几种方法: 1. 使用索引:确保查询涉及到的列有合适的索引。使用合适的索引可以提高查询的效率,减少扫描的数据量。根据查询条件和排序需求,创建适当的索引,以加速分页查询。 2. 使用游标分页:通过使用游标(Cursor)来获取分页数据,而不是传统的LIMIT和OFFSET语句。游标分页可以避免MySQL在每次查询时都重新扫描和跳过前面的记录,提高查询性能。 3. 使用分页缓存:将查询结果缓存在应用程序的内存中,避免每次都向数据库发送分页查询请求。可以使用缓存技术如Redis、Memcached等,将结果集按页缓存,并根据需要从缓存中获取数据。 4. 使用预取技术:通过一次性获取多页数据,而不仅仅是当前需要的一页。可以通过增加查询范围,一次性获取多个页面的数据,并在应用程序中进行缓存和管理,以提高后续分页查询的效率。 5. 数据分片:如果可能,将数据进行分片(Sharding),将数据分散存储在多个数据库中。这样可以将大量数据分散到不同的数据库中,从而减轻单个数据库的负载,提高查询性能。 需要根据具体的应用场景和需求选择合适的解决方案。同时,注意评估和测试每种解决方案的效果,以确保其适用性和性能提升。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值