MySQL中的索引

什么是索引?

简单来讲,索引的出现就是为了提高数据查询的效率,就像是书的目录一样,可以快速的查浏览整个文章中的内容。

索引的常见模型:

1.哈希表:

        哈希表示一种以键-值存储数据的结构,我们只要输入 待查找的键也就是key,就可以找到相对应的值也就是value。哈希的思路是:把值放到数组里面,然后用一个哈希函数把key换算成一个确定的位置,然后把value放在数组的这个;

        但是这样子是有缺点的,可能会造成位置重复;多个key值经过哈希函数的换算,可能会出现同一个值得情况。处理这种情况的一种方式就是列出来一个链表。

        以下面的例子为例:假设现在维护一个身份证新信息的姓名的表,需要根据身份证号查找对应的名字,哈希所对应的示意图如下:              

       看图可以看出来ID_card_n2和ID_card_n4所求出来的值都是N,但是可以看尽N的后面是一个链表,上面有User4和User2的分块,如果要查的是User2的数据,首先ID_card_n2通过哈希函数算出来的值是N,然后再在链表中顺序遍历查找,找到了user2.

        图示前面的ID_card_n1,ID_card_n2...这些值不是递增增加的,他们在增加的时候只需要往后面追加就可以了,这样的话增加新的User的时候,速度会很快,但相应的,因为他不是有序输入的,所以在进行区间查找的时候速度会很慢(所以在查找的时候可以采用等值查找的方式)

 有序数组:

有序数组在等值插叙和范围查询场景中的性能都非常优秀。

依旧以上面的例子为例:在有序数组的情况下,他是按照数组数递增的顺序来保存的;所以当你同样想查找ID_card_n2所对应的名字,利用二分查找的方式进行查询就可以了

二分查找:二分查找也叫做折半查找,但是要利用二分查找的方式的话需要存储的数据是采用顺序存储结构,假设一共有有数组元素50依次递增,你要查询的数是11,那么首先将50分为1~25和26~50,先比教11是在哪个里面,然后再继续将25平分两半,继续判断,最后在折半元素中进行顺序遍历进行比较,找到对应匹配的数。

 可以看出来,在没有身份证号码重复的情况下,他所排列的顺序就是递增来保存的,并且采用二分查找的方式很快就可以拆分查找出来,但是因为有序数组是采用递增的顺序保存的,所以在更新数据的时候就会很麻烦,尤其是要在中间插入的时候会更加麻烦。所以有序数组索引只适用于静态存储引擎 例如:保存某个城市某年的所有人口信息等等不会在修改的数据就很合适。

二叉搜索数

二叉搜索树又可以叫做二叉查找树,即每个节点最多有两子树的树结构,通常子树被称为左子树和右子树

二叉搜索树的特点是:父节点左子树所有节点的值小于父节点的值,右子树所有节点的值大于父节点的值。同样以身份证号查找自己名字为例,

 在查找ID_card_n2所对应的名字的时候,他所经历的查询顺序:【UserA>UserC>UserF>User2】这个时间复杂度是O(log(N)).

为了维持这个时间复杂度,需要保持这个树是平衡二叉树,同样,为了这个保证,所更新的时间复杂度也是O(log(N)).

平衡二叉树:

这种平衡二叉树每个节点都有数据区域,这也就意味着每次访问都需要访问磁盘;所以为了让一个查询尽量减少读取磁盘的次数,就必须让查询过程访问尽量少的数据块。那么就不应该使用二叉树了,而是要使用“N”叉树,这里的N取决于数据块的大小。

这里就衍生出来一个问题:N叉树的N是否可以人为的修改?

(38条消息) MySQL /“N叉树”的N值在MySQL中是可以被人工调整吗_Ruo_Xiao的博客-CSDN博客

 同时这里有涉及了B-树和B+树的相关概念。

InnoDB的索引模型

        在InnoDB中,表都是根据主键的顺序以索引的形式存放的,这种存储方式的表被称为索引组织表。同时InnoDB使用的是B+树的索引模型,所以数据都是存在B+树中;同时每一个索引在InnoDB中对应一课B+树。

        主键索引的叶子节点存的是整行数据。在InnoDB中,主键索引也被成为聚簇索引

        非主键索引的叶子节点内容是主键的值,在InnoDB中,非主键索引也被称为二级索引

基于主键索引和普通索引的查询有什么区别?
        举个例子:如果语句是select*from T where ID =500,即主键查询方式,则只需要搜索ID这颗B+树;如果语句是select *from T where k=5;即普通索引查询方式,则需要先搜素K索引树,得到ID的值为500,再到ID索引树搜索一次,这个过程称为回表。

         假设建立一个数据表,设置主键列为ID,表中有字段K,并且在K上有索引。

create table T(
id int primary key,
K int not null,
name varchar(16),
index(k))engine=InnoDB;

当我们在执行查询语句:select*from T where K between 3nd 5; 

 这样我们可以分为2个索引树,分别是K的索引和ID的索引,如果要执行一条SQL的查询语句的话,首先在K的索引树上找到了K=3的记录,知道了ID=300,然后再在ID的索引树上进行查找ID为300的用户名,即当ID=300的时候,name=R3。

        在这个过程中,回到主键索引树进行查找的过程,叫做回表。即由K索引树转到ID索引树的过程。

        

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值