mysql 利用延迟关联或者子查询优化超多分页场景

愿你惦记的人能和你道晚安,愿你一个人的日子里不觉得孤单,愿你早日遇见那个对的人,待你如初,疼你入骨,从此深情不被辜负

在MySQL中使用延迟关联(或子查询)来优化大量分页场景的方法。在具有大量数据的场景下,使用传统的 LIMIT offset, N 分页查询可能会导致性能问题。原因是MySQL不会跳过前 offset 行,而是获取 offset + N 行数据,然后丢弃前 offset 行,返回 N 行。

子查询

子查询(也称为内嵌查询、嵌套查询或子句查询)是嵌入在另一个查询(通常称为外部查询或主查询)中的SQL查询。

子查询用于从外部查询中筛选、计算或聚合数据。

子查询通常出现在 SELECTFROMWHEREHAVING 子句中,并且它们的结果会被外部查询使用。


以下是一个子查询的示例。我们假设有两个表:employeesdepartments,分别包含员工信息和部门信息。

CREATE TABLE employees (
    id INT PRIMARY KEY,
    first_name VARCHAR(30) NOT NULL,
    last_name VARCHAR(30) NOT NULL,
    salary DECIMAL(10, 2) NOT NULL,
    department_id INT NOT NULL
);

CREATE TABLE departments (
    id INT PRIMARY KEY,
    name VARCHAR(30) NOT NULL
);

假设我们想找到薪水高于某个部门的平均薪水的所有员工。我们可以使用子查询来完成这个任务:

SELECT e.id, e.first_name, e.last_name, e.salary, e.department_id
FROM employees e
WHERE e.salary > (
    SELECT AVG(salary)
    FROM employees
    WHERE department_id = e.department_id
);

在这个例子中,子查询 (SELECT AVG(salary) FROM employees WHERE department_id = e.department_id) 计算了每个部门的平均薪水。外部查询(主查询)通过比较员工的薪水与子查询的结果来筛选出薪水高于部门平均薪水的员工。

子查询在这里充当了 WHERE 子句的条件,用于比较每个员工的薪水。请注意,在子查询中使用了外部查询的变量 e.department_id,这允许子查询针对每个员工的部门计算平均薪水。

延迟关联

延迟查询(Delayed Query)通常指的是将一个查询分解成多个较小的查询,以提高查询性能。在MySQL中,这种策略通常被称为“延迟关联”(Delayed Join)或“延迟子查询”。延迟查询的目的是优化查询性能,尤其是在处理大量数据时。

此延迟非彼延迟

延迟查询中的“延迟”并不是指查询操作本身的延迟,而是指将一个复杂的查询拆分成多个较小、简单的查询步骤,以提高查询性能。这里的“延迟”是指在查询的执行过程中,我们把一部分操作延后处理,以降低单次查询中关联操作和计算的复杂度。

延迟关联或延迟子查询的主要优势是减少查询中处理的数据量,从而减轻数据库的压力。通过将一个复杂查询拆分成多个简单查询,可以让数据库更高效地利用索引、缓存和其他优化技术。

实际上,延迟查询的优化策略取决于数据量、表结构、索引和其他因素。在某些情况下,延迟查询可能比普通查询更快;在其他情况下,可能并没有显著的性能提升。在使用延迟查询时,需要根据具体场景分析和测试,以确定最佳的优化策略。

延迟查询示例

我们将使用之前的 employeesdepartments 表作为例子。

假设我们想要查询特定部门(例如,部门名称为 “Engineering”)的员工信息。传统的关联查询可能如下所示:

SELECT e.*
FROM employees e
JOIN departments d ON e.department_id = d.id
WHERE d.name = 'Engineering';

如果数据库包含大量数据,这个查询可能会导致性能问题,因为它需要关联两个表并筛选出符合条件的记录。

使用延迟查询策略,我们可以将此查询分解为两个较小的查询,以提高性能:

SELECT e.*
FROM employees e
WHERE e.department_id IN (
    SELECT d.id
    FROM departments d
    WHERE d.name = 'Engineering'
);

在这个例子中,我们首先使用子查询 (SELECT d.id FROM departments d WHERE d.name = 'Engineering') 来获取目标部门的 ID。然后,在外部查询中,我们只需从 employees 表中筛选出属于该部门的员工,而不需要实际执行关联操作。

这种延迟查询策略可以帮助减少查询处理的数据量,从而提高性能。然而,这种策略并非在所有场景下都有效,具体取决于表结构、数据量、索引等因素。在实际应用中,根据具体情况选择合适的优化策略是关键。

利用延迟关联或者子查询优化超多分页场景

当 offset 值非常大时,查询效率会降低,因为MySQL需要处理更多的数据。为了解决这个问题,可以采用两种方法:

  1. 控制返回的总页数:限制用户可以访问的最大页数,从而避免处理过多的数据。
  2. 对超过特定阈值的页数进行 SQL 改写:当页数超过特定阈值时,使用不同的查询方法来提高性能。

如何使用子查询来优化分页查询。这里的思路是首先快速定位需要获取的 id 段,然后再关联其他数据。示例查询如下:

SELECT a.* FROM1 a, (select id from1 where 条件 LIMIT 100000,20 ) b where a.id=b.id

这个查询分为两部分:

  1. 子查询 (SELECT id FROM 表1 WHERE 条件 LIMIT 100000, 20):在这个子查询中,我们只检索满足条件的记录的 id,而不是整个记录。这样可以减少查询的数据量。
  2. 主查询 SELECT a.* FROM 表1 a, ... WHERE a.id = b.id:在主查询中,我们使用子查询的结果(id 段)与原始表进行关联。这样我们只需要处理那些 id 在子查询结果集中的记录。

通过这种方法,我们可以显著提高大量分页场景下的查询性能。在实际应用中,请根据您的表结构和数据量选择合适的优化策略。

控制返回的总页数

在某些应用中,限制用户可以访问的最大页数是一种常见的策略。例如,如果每页显示10条记录,你可以限制用户只能访问前100页。这样,即使数据库中有成千上万条记录,查询也只会涉及到前1000条记录,从而避免了处理过多数据导致的性能问题。

在实际应用中,可以在应用程序逻辑层设置最大页数。例如,以下是一个PHP示例:

$page = intval($_GET['page']);
$perPage = 10;
$maxPage = 100;

if ($page > $maxPage) {
    $page = $maxPage;
}

$offset = ($page - 1) * $perPage;
$query = "SELECT * FROM employees ORDER BY id LIMIT $offset, $perPage";

这段PHP代码会确保用户访问的页数不会超过100页。如果用户尝试访问超过100页的内容,代码会自动将页数设置为100。

2. 对超过特定阈值的页数进行SQL改写

当页数超过特定阈值时,可以使用不同的查询方法来提高性能。例如,可以将OFFSET和LIMIT分页查询改为基于ID的查询。这样,对于大的分页数据,查询性能可以得到提高。

以下是一个基于ID的分页查询示例:

SELECT * FROM employees WHERE id > ? ORDER BY id LIMIT 10;

在这个示例中,我们首先获取上一页最后一条记录的ID(用 ? 占位符表示),然后查询ID大于该值的记录。这样,我们不再需要使用OFFSET,而是直接查询ID范围内的记录。

在实际应用中,你可以根据当前页数判断是否需要改写SQL。例如,如果当前页数小于特定阈值,可以使用OFFSET和LIMIT进行分页;如果当前页数超过阈值,则改为使用基于ID的查询。这样可以在不同的场景下实现性能的优化。

请注意,这些示例仅作为说明,实际情况可能因应用需求、数据量、表结构和索引等因素而有所不同。在实际开发中,请根据具体情况进行调整和测试。

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MyBatis-Plus是一个基于MyBatis的增强工具,它提供了很多便捷的功能来简化开发。在MyBatis-Plus中,多表关联查询和分页查询都是支持的。 对于多表关联查询,MyBatis-Plus提供了多种方式来实现,其中一种常用的方式是使用@TableName注解和@JoinTable注解。首先,在实体类上使用@TableName注解指定表名,然后在需要关联的字段上使用@JoinTable注解指定关联条件。通过这种方式,可以方便地进行多表关联查询。 下面是一个示例代码,演示了如何使用MyBatis-Plus进行多表关联查询: ```java // 实体类1 @TableName("table1") public class Entity1 { @TableId private Long id; private String name; // ... } // 实体类2 @TableName("table2") public class Entity2 { @TableId private Long id; private Long entityId1; private String info; // ... } // Mapper接口 public interface EntityMapper extends BaseMapper<Entity1> { @Select("SELECT t1.*, t2.info FROM table1 t1 LEFT JOIN table2 t2 ON t1.id = t2.entity_id1") List<Entity1> selectEntityWithInfo(); } ``` 在上述示例中,Entity1和Entity2分别对应数据库中的table1和table2表。通过@JoinTable注解,我们可以在EntityMapper接口中定义一个自定义的查询方法selectEntityWithInfo(),该方法使用了LEFT JOIN来实现多表关联查询,并返回Entity1的列表。 对于分页查询,MyBatis-Plus提供了Page对象来支持分页功能。在查询方法中,可以通过传入Page对象来指定分页参数,然后使用MyBatis-Plus提供的分页查询方法进行查询。查询结果会被封装到Page对象中,包含了总记录数、当前页数据等信息。 下面是一个示例代码,演示了如何使用MyBatis-Plus进行分页查询: ```java // Mapper接口 public interface EntityMapper extends BaseMapper<Entity1> { @Select("SELECT * FROM table1") IPage<Entity1> selectEntityWithPage(Page<Entity1> page); } ``` 在上述示例中,EntityMapper接口中的selectEntityWithPage()方法使用了Page对象作为参数,并通过@Select注解指定了查询语句。在实际调用时,可以创建一个Page对象并传入分页参数,然后调用selectEntityWithPage()方法进行分页查询。 以上就是使用MyBatis-Plus进行多表关联查询和分页查询的简单介绍。如果你还有其他问题,请继续提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值