MySQL数据结构：查询优化的幕后功臣-CSDN博客

本文链接：https://blog.csdn.net/zgt_certificate/article/details/141004151

在这里插入图片描述

1. MySQL查询优化器的主要数据结构

MySQL查询优化器涉及到的主要数据结构包括查询树、基本对象、连接表等。这些结构用于优化和执行SQL查询。

1.1 查询树

定义: 查询树是语法分析器将SQL解析后生成的数据结构，用于表示SQL语句的各个部分。
类定义: st_select_lex类是查询树的核心，继承自st_select_lex_node类，保存了SQL语句的结构信息。

主要成员:

WHERE和HAVING子句: Item *where, *having;
FROM子句中的表对象: SQL_I_List<TABLE_LIST> table_list;
ORDER BY子句: SQL_I_List<ORDER> order_list;
LIMIT子句: Item *select_limit, *offset_limit;

示例:
假设有如下SQL语句：

SELECT * FROM employees WHERE age > 30 ORDER BY salary DESC LIMIT 10;

该查询会被解析成一个查询树，st_select_lex类实例将包含：

where: age > 30
order_list: salary DESC
select_limit: 10

1.2 基本对象

基本对象主要包括关系（表）、索引（Key）、连接表等。

1.2.1 关系（TABLE_LIST）

定义: TABLE_LIST结构用于存储表的相关信息，是MySQL中一个表在逻辑上的表示。
成员属性:
- 表的基本属性信息: 如数据库名、表名、别名等。
- 连接条件: 存储各种连接条件。

示例:
如果有一个表employees，TABLE_LIST结构将包括：

table_name: "employees"
alias: 表的别名（如果有）

1.2.2 索引（Key）

定义: 索引类Key定义了MySQL支持的索引类型和索引的关键信息。
索引类型:
- PRIMARY: 主键索引
- UNIQUE: 唯一索引
- FULLTEXT: 全文索引
- SPATIAL: 空间索引
- FOREIGN: 外键索引
索引算法:
- BTREE: B-tree算法，默认使用
- RTREE: R-tree算法，用于空间搜索
- HASH: 哈希算法，用于哈希搜索
- FULLTEXT: 全文搜索，主要用于MyISAM

示例:
创建一个具有多种索引的表：

CREATE TABLE employees (
  id INT PRIMARY KEY,
  name VARCHAR(100),
  position VARCHAR(50),
  department_id INT,
  FULLTEXT KEY (name),
  FOREIGN KEY (department_id) REFERENCES departments(id)
);

在这个表中，索引类Key将定义主键、全文索引和外键索引。

1.2.3 连接表（JOIN_TAB）

定义: 连接表是关系和连接类之间的一个过渡对象，用于存储连接操作的信息。
作用: 在执行JOIN操作时，连接表存储了所需的信息，使得连接过程更加高效。

示例:
在进行连接查询时，如：

SELECT e.name, d.name
FROM employees e
JOIN departments d ON e.department_id = d.id;

在执行上述查询时，JOIN_TAB将会保存employees和departments之间的连接信息。

2. 数据结构的实现

以下是上述数据结构在MySQL源码中的实现细节。

2.1 `st_select_lex` 类的定义

查询树st_select_lex类的定义如下：

class st_select_lex : public st_select_lex_node {
  // SELECT语句的各子句
  Item *where, *having;                 // WHERE, HAVING子句
  SQL_I_List<TABLE_LIST> table_list;    // FROM子句中的表对象
  SQL_I_List<ORDER> order_list;         // ORDER BY子句
  Item *select_limit, *offset_limit;    // LIMIT子句

  // 连接相关
  JOIN *join;                           // 连接树
  List<TABLE_LIST> top_join_list;       // 顶层的连接链表
  List<TABLE_LIST> *join_list;          // 当前被分析的连接链表
  List<TABLE_LIST> sj_nests;            // 半连接嵌套链表
  TABLE_LIST *leaf_tables;              // 基本表
  ...
};

2.2 `TABLE_LIST` 结构体的定义

TABLE_LIST用于描述一个表的结构：

struct TABLE_LIST {
  char *db, *alias, *table_name, *schema_table_name; // 表的基本属性信息
  ...

  // 与连接相关的一些信息和方法
private:
  Item *m_join_cond; // 用于外连接

public:
  Item *prep_join_cond;  // 存放连接条件
  Item *sj_on_expr;      // 半连接的条件
  table_map sj_inner_tables;  // 半连接的表对象
  COND_EQUAL *cond_equal; // 外连接的条件
  ...
};

2.3 `Key` 类的定义

Key类定义了索引的类型和信息：

class Key : public Sql_alloc {
public:
  enum Keytype { PRIMARY, UNIQUE, MULTIPLE, FULLTEXT, SPATIAL, FOREIGN_KEY };
  enum Keytype type; // 索引类型
  KEY_CREATE_INFO key_create_info; // 索引元信息

  List<Key_part_spec> columns; // 索引列信息
  LEX_STRING name;
  bool generated;
  ...
};

KEY_CREATE_INFO: 包括索引算法、名称等信息。

enum ha_key_alg {
  HA_KEY_ALG_UNDEF = 0,   // 未指定
  HA_KEY_ALG_BTREE = 1,   // B-tree算法
  HA_KEY_ALG_RTREE = 2,   // R-tree算法
  HA_KEY_ALG_HASH = 3,    // HASH算法
  HA_KEY_ALG_FULLTEXT = 4 // 全文索引
};