索引
概念:索引是帮助mysql高效查找数据且排序好的一种数据结构
mysql存储索引使用2种方式:
1,hash:hash方式等值查询效率很高,但是范围查询效率退化成全表扫描。
2,B+树(外排序的一种实现)
mysql 一般使用 B+树,建立索引结构,3层即可满足千万级别数据索引的存储,大大减少了磁盘io的次数。同时b+树叶子结点顺序存储了所有索引元素,相当于一个顺序表,根据树结构查找到对应的元素上下界后,可以很好的支持范围查找。
mysql 支持的B+树:
- 非叶子节点不存储data,只存储索引,所以每个树节点可以存储更多的索引。(树的一个节点一般为16k)
- 叶子节点不用存储指针
- 叶子节点提供了顺序访问的指针,可提高区间访问的性能,更好的支持了范围查询
mysql常用引擎:
mylSAM存储引擎:其索引实现为:
data种存放的是每一列数据的地址信息。
InnoDB索引实现(聚集索引):
-
表数据文件本身就是按照B+tree组织的一个索引结构文件
-
聚集索引-节点包含了完整的数据记录
-
问题1:为什么InnoDB表必须有主键?并且推荐使用整形的自增主键?
答:是因为这样可以使插入一条数据永远为最后一条数据(如果使用的是varchar类型的作为主键,则新插入一条数据,有可能是在中间插入,可能会增加分裂次数,增加维护开销),在叶子链表的最后,减少b+树分裂的次数,这样就降低了维护代价
-
问题2:为什么非主键索引结构的叶子节点存储的是主键值?
答:为了一致性(个人理解:防止当增加一条数据时,需要在多个索引结构中进行多数据的添加)。节省存储空间。
:防止当增加一条数据时,需要在多个索引结构中进行多数据的添加)。节省存储空间。