目录
1 索引的数据结构
1.1 索引
聚集索引
索引的键值的逻辑顺序决定表中数据(行)的物理顺序,可以理解为如果索引是连续的,那么表中数据在存储介质上的顺序也是一致的。
就如同在字典中通过拼音查找一个汉字,字典中拼音也是按照顺序连续排列的(a、b、c、d),对应的汉字就按照这个顺序连续排列。在使用聚集索引查找一个范围的值时,可以通过索引找到第一条数据,然后根据数据的物理地址连续的特点查找这条数据相邻的数据,这样能够快速的找到对应的想要查找的数据。
非聚集索引
索引的键值逻辑顺序与数据的物理存储顺序无关,虽然索引的键值是连续的,但是他们对应的数据在介质中的物理顺序却不是连续的。索引的记录节点有一个记录指针,指向子树的根节点,存储子节点所在磁盘块的地址。
1.2 树
二叉查找树
平衡二叉树
在二叉查找树的基础上满足任意节点的两个子树高度差为1
平衡二叉树,在插入或删除节点时会导致失衡,这时候可以根据旋转来解决。
b树
b树 中的b指的是balance 平衡的意思,b树是指平衡多路查找树。
特征:
- 每个节点最多有m个孩子。
- 除了根节点和叶子节点外,其它每个节点至少有Ceil(m/2)个孩子。
- 若根节点不是叶子节点,则至少有2个孩子
- 所有叶子节点都在同一层,且不包含其它关键字信息
- 每个非终端节点包含n个关键字信息(P0,P1,…Pn, k1,…kn)
- 关键字的个数n满足:ceil(m/2)-1 <= n <= m-1
- ki(i=1,…n)为关键字,且关键字升序排序。
- Pi(i=1,…n)为指向子树根节点的指针。P(i-1)指向的子树的所有节点关键字均小于ki,但都大于k(i-1)
b+ -tree
1.3 为什么b+ -tree更适合用于建立索引
- 磁盘读写代价更低(非叶子节点不存储关键字信息,只存放指针,这样每个节点能够存储跟多的指针,极大的减少了树的层数)
- 查询效率更加稳定(每次查找的路径都需要一直到叶子节点,所需时间更加稳定)
- 更有利于数据库的扫描(可通过叶子节点之间连接的指针进行范围查找或者遍历整棵树)
2 还有哪些索引
2.1 hash索引
为什么hash所以不能成为主流
2.2 BitMap位图索引
3 密集索引和稀疏索引
3.1 区别
- 密集索引文件中每个文件的搜索码都对应一个索引值
- 稀疏索引文件只为索引码的某些值建立索引项
密集索引简单的说就是:叶子节点不但存放键值,还保存了表中该行其他列的信息。密集索引决定了表的物理排列数据,而一张表只有一个排列顺序,既一张表只有一个密集索引。
稀疏索引:叶子节点只保存键值信息和该行的地址,有的甚至只保存键位信息机器主键。
3.2 Mysql中的密集和稀疏索引
为什么一定要一个密集索引
在InnoDB中使用辅助索引查找将会查找两次
最左匹配原则
成因:
mysql对第一个字段进行排序,在此基础上再对第二个排序,然后对第三个,以此类推。类似order by字段1,字段2