索引介绍
索引(index) 是一种高效查找数据存储在磁盘的数据结构,用生活举例子那就是给数据加了目录
索引数据结构
上一篇文章我说过索引的结构是B +Tree,那么为什么不用二叉树或者B -Tree了 我一一举例说明
平衡二叉树
假如索引使用平衡二叉树 主键为索引那么它的存储形式如下图
现在我需要找id为17的数据 只需比较一次即可找到,看起来是比较迅速,但是如果我要找的是id为1的话那么查的次数也就增多了
(1)二叉树优点:确实某种情况下也能提高查找速率
(2)二叉树缺点:大量数据下查找仍然需要多次,在极端情况下 若后面新增数据都是越来越小那么二叉树也就变成了链表形式这样二叉树也就失去了它的作用
B -Tree
假如索引使用五阶B -Tree, 主键为索引那么它的存储形式如下图
由上图可以知道在B -Tree数据都是和key存储在一起的
B +Tree
可以发现B +Tree 与 B -Tree两种结构存储的区别在于 B +Tree的数据是存储在叶子节点下的 而B -Tree 是存储在每一个key下 上一章我有提过每一页存储大小是16k,也就是说B+Tree能存储的key远远比B -Tree多,在大量数据中 B -Tree为了能存储等量key与value 不得不拉高树的高度 从而导致 IO操作增多,所以这就是为什么B+Tree树是作为索引结构来存储的