今天面试的时候,面试官问我为什么索引可以加快查询效率,把我问懵了,平时只知道建表必须得加索引,然后查找的时候也必须带上索引,我是菜菜鸡中的战斗机,今天来详细学习一下
索引的定义(百度百科)
索引是对数据库表中一个或多个列(例如,employee 表的姓名 (name) 列)的值进行排序的结构。
例如这样一个查询:select * from table1 where id=10000。如果没有索引,必须遍历整个表,直到ID等于10000的这一行被找到为止;有了索引之后(必须是在ID这一列上建立的索引),即可在索引中查找。由于索引是经过某种算法优化过的,因而查找次数要少的多。可见,索引是用来定位的。
从数据搜索实现的角度来看,索引也是另外一类文件/记录,它包含着可以指示出相关数据记录的各种记录。其中,每一索引都有一个相对应的搜索码,字符段的任意一个子集都能够形成一个搜索码。这样,索引就相当于所有数据目录项的一个集合,它能为既定的搜索码值的所有数据目录项提供定位所需的各种有效支持
但是,如果索引过多,应用程序中的更新、删除等操作会变慢,性能会受到影响,这个时候需要精简索引;如果索引过少,对查询性能又会产生影响
InnoDB存储引擎索引
分为两种
b+ 树索引
是传统意义上的索引,这是目前关系型数据库最常用、最有效的索引。b+ 树的索引构造类比与二叉树,根据键值快速找到数据。
hash 索引
是自适应的,innodb 会根据表的使用情况自动自动为表生成 hash 索引。
b+树是b-树的一种变体,比b-树的查询性能更高。
b-树就不去了解了,真的看得我脑壳有点疼。
b+树定义(百度百科)
每个结点的关键字个数与孩子个数相等,所有非最下层的内层结点的关键字是对应子树上的最大关键字,最下层内部结点包含了全部关键字。 [3]
除根结点以外,每个内部结点有 到m个孩子。 [3]
所有叶结点在树结构的同一层,并且不含任何信息(可看成是外部结点或查找失败的结点),因此,树结构总是树高平衡的。
还有慢慢写⑧
我建议看这个链接这位姐妹转载的文章,通俗易懂