全表扫描和索引扫描的查询过程

木乔爷

已于 2024-02-01 11:24:00 修改

阅读量326

点赞数 4

文章标签： sql postgresql

于 2024-02-01 11:19:32 首次发布

本文链接：https://blog.csdn.net/qq_14872005/article/details/135969836

版权

本文详细解释了数据库管理系统如何利用系统表在查询解析、优化、计划生成和执行阶段工作，重点强调了Vacuum操作对reltuples值的影响，以及如何通过更新统计信息来优化查询性能。

摘要由CSDN通过智能技术生成

在查询过程中，数据库管理系统使用多个系统表来生成执行查询的计划。以下是将系统表与查询过程的各个阶段融合在一起的描述：

1. 查询解析阶段：
- 数据库管理系统解析用户提交的查询语句，并获取查询目标表的名称和所属模式。这使用了系统表 `pg_class` 和 `pg_namespace`。
- 系统表 `pg_attribute` 用于获取目标表的列信息，包括列名、数据类型等。

2. 查询优化阶段：
- 使用系统表 `pg_class` 和 `pg_index`，数据库管理系统确定可用的索引，并评估索引的选择性、大小等因素。
- 通过访问系统表 `pg_statistic`，优化器获取关于表的统计信息，如列值分布、空值比例等。这些信息用于生成查询计划和估计查询成本。

3. 查询计划生成阶段：
- 获取表的存储位置和数据块的相关信息，这需要访问系统表 `pg_class`。
- 使用系统表 `pg_attribute`，确定需要检索的列和其位置信息。
- 使用系统表 `pg_constraint`，检查查询涉及的约束条件，如主键、唯一键、外键等。

4. 执行查询阶段：
- 对于索引扫描，数据库管理系统按照索引的存储结构，逐个读取索引页，并根据索引键值定位到对应的数据行。这需要访问系统表 `pg_index`。
- 对于全表扫描，数据库管理系统从磁盘读取整个表的数据页，并按照顺序逐页地扫描所有数据行。这需要访问 `pg_class` 来获取表的存储位置。
- 在执行查询过程中，系统表 `pg_constraint` 用于检查约束条件，确保数据的完整性和一致性。

通过融合系统表在查询过程中的使用，数据库管理系统能够获得元数据和统计信息，并根据这些信息生成高效的查询计划。这些系统表在查询优化和执行阶段的决策过程中发挥了关键作用，帮助提高查询性能和准确性。

Vacuum对全表扫描查询reltups有影响吗？

在 PostgreSQL 中，`reltuples` 是 `pg_class` 系统表中的一个属性，用于表示表中的估计行数或元组数量。这个值在查询优化和执行计划生成过程中起着重要的作用。

当进行 Vacuum 操作时，它可能会更新 `reltuples` 的值，以反映最新的实际行数。Vacuum 会收集并更新统计信息，其中包括每个表的行数估计。它会分析表中的数据分布并更新 `pg_statistic` 系统表，以便查询优化器可以更准确地估算查询计划的成本。

由于 Vacuum 的影响，`reltuples` 的更新可能导致全表扫描查询的成本估计发生变化。如果 Vacuum 后的行数估计更准确，查询优化器可能会更倾向于选择全表扫描，因为它认为需要扫描的行数更少。

然而，值得注意的是，Vacuum 更新的 `reltuples` 只是估计值，并不一定完全准确。如果表中有修改或删除的操作，这个估计值可能会与实际行数有一定的偏差。查询优化器仍然需要考虑其他因素，如索引的可用性、磁盘访问成本等，来确定最佳的查询计划。

为了确保查询计划的准确性，可以定期运行 Vacuum，并根据需要更新统计信息。这有助于提供更准确的行数估计，并改善全表扫描查询的性能。

木乔爷

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
全表扫描和索引扫描的查询过程

通过融合系统表在查询过程中的使用，数据库管理系统能够获得元数据和统计信息，并根据这些信息生成高效的查询计划。这使用了系统表 `pg_class` 和 `pg_namespace`。- 使用系统表 `pg_class` 和 `pg_index`，数据库管理系统确定可用的索引，并评估索引的选择性、大小等因素。- 在执行查询过程中，系统表 `pg_constraint` 用于检查约束条件，确保数据的完整性和一致性。- 获取表的存储位置和数据块的相关信息，这需要访问系统表 `pg_class`。
复制链接

扫一扫