背景:
数据在磁盘上随机写入,查询数据时如果在磁盘上挨个读取速度会非常慢,这时就需要想办法把查询控制在一个范围内
索引:
索引是 帮助mysql高效获取数据的排好序的数据结构
索引数据结构:
- 二叉树:单边数据增长的情况数据查询会很慢
- 红黑树(平衡二叉树):单边数据增长会做平衡处理,有自动平衡功能,左子树和右子树相差绝对值<=1,缺点:随着数据量增加树高越来越高,查询速度也越来越慢
- B树:基于平衡二叉树每个节点放多个元素,高度即变矮
- hash索引:对索引的key进行一个hash运算就可以定位到数据的存储位置,大多数时比B+树索引更快,仅能满足“=” “in”,不支持范围查找,hash冲突问题
- B+树:非叶子节点放索引(冗余索引,存放每一个磁盘页的第一个元素,为了构建B+树),叶子节点放索引和数据(所有的索引和数据),叶子节点从左至右以此递增(单向链表),叶子节点之间用指针连接,提高区间访问性能
数据查找过程:
比如要查找一个col=30的数据,从B+树的根节点开始查找,首先把最上层级的磁盘页数据读取到内存,找到位置后再把下一个磁盘页数据读取到内存,找到