1、为什么要有索引?
在进行数据查询时,如果没有索引,就需要一条条数据进行扫描,对比,最终找到想要的结果,需要的是全表扫描。
有了索引后,就相当于是查字典,先根据目录,定位到某个章节,然后在章节内再查找,查找速度会加快。
所以索引的功能就是加快查询速度。
select * from user where age = 45
在无索引情况下,就需要从第一行开始扫描,一直扫描到最后一行,我们称之为 全表扫描,性能很低。
有索引后,首先36比45小,看36左侧分支,然后48比45大,看右侧分支,在看45,查询到结果
所以只需要三次查询
2、索引是什么?
索引相当于是字典的目录,是一种也需要占页数(存储空间)的数据结构
索引(
index
)是帮助
MySQL
高效获取数据的数据结构
(
有序
)
。在数据之外,数据库系统还维护着满足
特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构
上实现高级查找算法,这种数据结构就是索引。
索引-->数据
创建索引后,数据库需要维护索引和数据之间的关系。所以需要占用空间
但是新增或更新、删除数据时,也需要处理索引,所以对增删改效率降低
3、索引结构
MySQL
的索引是在存储引擎层实现的,不同的存储引擎有不同的索引结构,主要包含以下几种:
不同的存储引擎对于索引结构的支持
4、为什么选择B+树作为索引结构
二叉树
使用二叉树作为数据结构:如果数据的顺序是有序的,那么插入后形成的数据就是一个单向链表,索引起不到加快查询的作用
还有就是如果数据量大的时候,二叉树的层级太深,也会降低检索速度
所以,如果选择二叉树作为索引结构,会存在以下缺点:
- 顺序插入时,会形成一个链表,查询性能大大降低。
- 大数据量情况下,层级较深,检索速度慢。
红黑树是一颗自平衡二叉树,那这样即使是顺序插入数据,最终形成的数据结构也是一颗平衡的二叉树
,
由于红黑树也是一颗二叉树,所以也会存在一个缺点:
大数据量情况下,层级较深,检索速度慢。
B树
树的度数指的是一个节点的子节点个数
B-Tree
,
B
树是一种多叉路衡查找树,相对于二叉树,
B
树每个节点可以有多个分支,即多叉。
以一颗最大度数(
max-degree
)为
5(5
阶
)
的
b-tree
为例,那这个
B
树每个节点最多存储
4
个
key
,
5
个指针:
B+Tree
B+Tree
与
B-Tree
相比,主要有以下三点区别:
- 所有的数据都会出现在叶子节点。
- 叶子节点形成一个单向链表。
- 非叶子节点仅仅起到索引数据作用,具体的数据都是在叶子节点存放的。
MySQL
索引数据结构对经典的
B+Tree
进行了优化。在原
B+Tree
的基础上,增加一个指向相邻叶子节点
的链表指针,就形成了带有顺序指针的
B+Tree
,提高区间访问的性能,利于排序。
绿色框框起来的部分,是索引部分,仅仅起到索引数据的作用,不存储数据。
红色框框起来的部分,是数据存储部分,在其叶子节点中要存储具体的数据。
Hash索引
MySQL
中除了支持
B+Tree
索引,还支持一种索引类型
---Hash
索引。
哈希索引就是采用一定的
hash
算法,将键值换算成新的
hash
值,映射到对应的槽位上,然后存储在
hash表中。
如果两个
(
或多个
)
键值,映射到一个相同的槽位上,他们就产生了
hash
冲突(也称为
hash
碰撞),可
以通过链表来解决。
A,Hash
索引只能用于对等比较
(=
,
in)
,不支持范围查询(
between
,
>
,
<
,
...
)
B.
无法利用索引完成排序操作
C.
查询效率高,通常
(
不存在
hash
冲突的情况
)
只需要一次检索就可以了,效率通常要高于
B+tree
索引
存储引擎支持
在
MySQL
中,支持
hash
索引的是
Memory
存储引擎。 而
InnoDB
中具有自适应
hash
功能,
hash
索引是
InnoDB
存储引擎根据
B+Tree
索引在指定条件下自动构建的。
5、索引分类
.联合索引 -primary key(id,name):联合主键索引 -unique(id,name):联合唯一索引 -index(id,name):联合普通索引
聚集索引选取规则
:
- 如果存在主键,主键索引就是聚集索引。如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
- 如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索
- 引。