MySQL索引机制
索引的定义和工作原理
索引的定义
索引是为了加速对表中数据进行的检索而创建的一种分散存储的数据结构。
MySQL为什么选择B+Tree
模拟数据结构的网站:https://www.cs.usfca.edu/~galles/visualization/BST.html
binary search tree(二叉查找树)
优点:提高检索速度
缺点:看图二,如果查找0005,跟全表扫描没有任何区别,如果数据组织出现一些问题,会对性能造成一些时间差
balanced binary search tree(平衡二叉查找树)相对平衡的书
缺陷:
- 搜索时IO次数过多
- 节点数据内容太少
balanced tree(多录平衡二叉查找树)
以上两张图为Btree的存储结构的排序过程(频繁合并分解)
从第一张彩色图中可以看出,每一个节点可以有多个子节点,且每一个节点(包括非叶子节点)均存储数据,采用中序遍历便可查找到所有数据。但是,数据库磁盘交互是按页为单位(MySQL默认为16K)的,如果数据量过多时,每个节点存储的键值会较少,进而树的高度比较高,导致磁盘I/O比较多。同时,在实际项目中,范围查询的SQL比较频繁,倘若采用B树作为索引结构,需要中序遍历很多节点,来收集符合筛选条件的数据集。因此,此结构某种程度来看,不是太合适。
加强版多路平衡查找-B+树
MySQL中B+tree索引如何落地
MySQL中B+tree索引体现形式-Myisam