目录
索引介绍
帮助MySQL高效获取数据的数据结构
存储在磁盘上,单独存储或者和数据一起存储
优势:提高检索效率,降低数据库IO成本;
劣势:占用磁盘空间,会降低更新效率
索引类型
主键索引:值唯一,不能重复,不能为空
普通索引:没有额外限制,基本索引
唯一索引:值唯一,允许为空
全文索引:只能在文本类型char,varchar,text类型字段上建立
空间索引:MySQL5.7之后支持,支持OpenGIS几何数据模型
前缀索引:文本类型的列上创建,可以指定长度,数值类型不能指定
1.索引数据结构
磁盘相关知识点:系统从磁盘读取数据到内存是按照磁盘块为基本单位,位于同一个磁盘块的数据会被一次性读出来
InnoDB存储引擎中Page:page是磁盘管理的最小单位,InnoDB默认每个页大小16kb,可通过innodb_page_size设置大小
而系统一个磁盘块的存储空间没有这么大,所以InnoDB每次申请磁盘空间度都是读取若干个地址连续的磁盘块装满page
Hash索引
索引列以Hash存储,等值查询效率很高,O(1),不支持范围快速查询,范围查询只能通过全表扫描实现
1>为什么二叉树不适合?
二叉树特点:每个节点最多有两个子节点,左子节点<父节点<右子节点
1.数据量越大,树的层级越深,查询扫描时增加IO次数,效率低
2.数据分部不均极端情况下,若数据是按照顺序存储,形同链表,查询扫描时效率低
2>平衡二叉树为什么不适合?
平衡二叉树特点: 左右子树深度差绝对值不超过1
虽然解决了二叉树的数据分部不均的问题,还存在以下问题
1.每次插入或删除数据时,需要通过左旋或者右旋维护树的平衡状态,效率降低
2.同样存在数量过多时,树层级过深的问题
3.范围查询需要从根节点多次遍历,查询效率不高
3>B-Tree 平衡多路查找树
先定义一条记录为一个二元数组[key,data],key为记录主键值,data数据记录