MySQL 索引

fxm树鹿

已于 2025-03-21 14:45:58 修改

阅读量1.2k

点赞数 17

文章标签： mysql 索引

于 2024-03-12 17:56:03 首次发布

本文链接：https://blog.csdn.net/qq_43157273/article/details/136555109

版权

本文详细介绍了MySQL中不同类型的索引（如B+树、哈希索引等），数据结构在查询效率上的影响，以及如何通过索引优化、避免索引失效和最左前缀匹配等方法提高查询性能。涵盖了数据页、文件头、页目录等概念，并讨论了回表与索引覆盖现象以及索引选择和使用策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据库的 I/O 操作的最小单位是 **数据页**，InnoDB 默认的大小是 16KB
数据页包括 文件头、用户记录、页目录等

文件头：有两个指针，分别指向上一个数据页和下一个数据页，连接起来相当于一个双向的链表
用户记录：按照主键顺序组成单向链表
页目录：由多个槽按照先后顺序组成
- 将用户记录划分成几个组，记录包括最小记录(第一条记录)和最大记录(最后一条记录)
- 组中最后一条记录会存储该组一共有多少条记录
- 组中最后一条记录的地址偏移量称为槽，相当于分组记录的索引

如果某个查询语句使用了二级索引，但是查询的数据不是主键值，这时在二级索引找到主键值后，需要去聚簇索引中获得数据行，这个过程就叫作「回表」，也就是说要查两个 B+ 树才能查到数据。
当查询的数据是主键值时，因为只在二级索引就能查询到，不用再去聚簇索引查，这个过程就叫作「索引覆盖」，也就是只需要查一个 B+ 树就能找到数据。

第一范式：确保每列保持原子性
第二范式：确保表中的每列都和主键相关
第三范式：确保每列都和主键列直接相关,而不是间接相关，不存在传递依赖
设计合理的数据表
- 将数据分解为合适的表，避免将过多的数据存储在单个表中
- 每个表都应该有清晰定义的目的
表、字段规范
- 表名、字段名应该使用小写字母，采用下划线分割
- 表达是与否概念的字段，必须使用 is _ xxx 的方式命名，数据类型是 unsigned tinyint（ 1 表示是，0 表示否）
- 表必备三字段： id 主键, gmt _ create创建时间 , gmt _ modified更新时间
- 不同表之间存储相同数据的列名和列类型必须一致(关联列)
- 不得使用外键与级联
- 增加冗余字段
选择合适的数据类型
- 优先选择符合存储需要的最小、最简单的数据类型
- 小数类型为 decimal ，禁止使用 float 和 double
- 日期使用date、时间使用时间戳
避免使用过多的NULL值

使用EXPLAIN关键字可以模拟优化器执行SQL查询语句

限制索引的数目
数据量小的表最好不要使用索引
尽量使用数据量少的索引
避免使用长字符串作为索引、尽量使用前缀来索引
索引最好设置为 NOT NULL
关联查询优化
- 内连接时，mysql 会自动把小结果集选为驱动表，所以大表字段需加上索引
- 左外连接时，左表（驱动表）会全表扫描，所以右边大表字段需加上索引
- 右外连接同理，被驱动表上的字段需建立索引
排序、分组优化
- 尽量避免使用Using FileSort方式排序
- 语句满足索引最左匹配
- 不要出现索引范围查询
慢查询日志
定期维护索引
监控数据库性能
删除不再使用或者很少使用的索引