关于MySql索引的知识点整理,包括索引的选择(为何用B+树),存储引擎等。
关键知识点:
1.索引数据结构:哈希表,红黑树,B树,B+树
2.索引是则么支撑千万级表的快速查找的
3.如何基于索引B+树精准建立高性能索引
4.什么是回表
5.存储引擎Innodb,Myisam
5.聚簇索引与非聚簇索引
6.索引覆盖
7.索引下推
要知道,索引之前是有关磁盘的读写,io的效率是很低的,于是就有了关系型的key-value数据存储。代表就是mysql。
为什么用B+树,其实就是数据结构分析的过程
mysql是按照页加载数据的,默认页大小为16KB,一个块需要读16k的数据
假设一行是1k,那么可以存16 * 16 * 16 = 4096条记录
怎么提高性能呢?需要 增加分叉,保持有序,也就是有序多叉树,引出B+树
B+树只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作(或者说效率太低)。
正如上面所说,在数据库中基于范围的查询是非常频繁的远多于精准查询,因此MySQL最终选择的索引结构是B+树而不是B树。
big int占8b 指针占用6b 一共就是14b 16KB能存储1170(约等于)条数据,这是一页能存储1170条
深度是2的话就是1170 * 1170
深度是3的话就是1170 * 1170 * 1170 条
当然这是很理想的情况(页可能不满等)
一般情况下是2-3层,就是你基本不会见到一张表里有数十亿条数据吧
记得有些乱,(非常乱)