mysql 索引
索引是帮助mysql高效获取数据的排好序
的数据结构
mysql 底层采用了B+Tree的方式存储数据
索引数据结构
-
二叉树:
- 缺点:数据量大时,数会变得很高
- 缺点:如果索引递增,树则变成了链表
-
红黑树:二叉平衡树,对二叉树进行了优化
- 缺点:数据量大时,数会变得很高
-
hash表:
- 对索引的key进行一次hash计算就可以定位出数据存储的位置
- 很多时候Hash索引要比B+ 树索引更高效
- 仅能满足 “=”,“IN”,不支持范围查询
- hash冲突问题
-
B-Tree:
- 叶节点具有相同深度,叶节点的指针为空
- 所有索引元素不重复
- 节点中的数据索引从左到右递增排列
-
B+Tree (B-Tree变种)
- 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
- 叶子节点包含所有索引字段
- 叶子节点用指针连接,提高区间访问的性能
聚集索引
- MyISAM索引文件和数据文件是分离的(非聚集),有三个文件,需跨文件查询,速度相对慢
- InnoDB索引实现(聚集),有两个文件,不需要跨文件查询,速度快
- 表数据文件本身就是按B+Tree组织的一个索引结构文件
- 聚集索引-叶节点包含了完整的数据记录
- 为什么建议InnoDB表必须建主键,并且推荐使用整型的自增主键?
- 节省空间,提高效率,组建树结构时,排序更快,一层树的大小为16KB,可以存储更多索引,查询时更小的io开销,树的高度更小,树的高度越小查询效率越高,效率内存储的数据上限也就越高
- 为什么非主键索引结构叶子节点存储的是主键值?(一致性和节省存储空间)
聚集索引-叶节点包含了完整的数据记录
二级索引
二级索引叶子结点存储的是主键索引,取整行数据时需要回表操作
索引最左前缀原理
- 联合索引的底层存储结构
如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
例如,select * from table where name = 'Bill' and position = 'dev'
则无法走索引查询。