学习数据库索引

在聊到数据库优化的时候,很多程序员不假思索第一句基本都是,查询速度快需要加索引。

今天学习一下加索引的意义在哪里:

在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。

索引提供指向存储在表的指定列中的数据值的指针,然后根据您指定的排序顺序对这些指针排序。数据库使用索引以找到特定值,然后顺指针找到包含该值的行。这样可以使对应于表的SQL语句执行得更快,可快速访问数据库表中的特定信息。

当表中有大量记录时,若要对表进行查询,第一种搜索信息方式是全表搜索,是将所有记录一一取出,和查询条件进行一一对比,然后返回满足条件的记录,这样做会消耗大量数据库系统时间,并造成大量磁盘I/O操作;第二种就是在表中建立索引,然后在索引中找到符合查询条件的索引值,最后通过保存在索引中的ROWID快速找到表中对应的记录。

首先,数据库的表本身自带一个聚集索引,即是每个表的主键,每个主键对应唯一一条数据。索引的结构是一棵平衡二叉树,导致查询速度相较于遍历来说成指数级下降。只要查到树中的主键所在,就能查到主键对应的这条数据的值。

当然很多时候我们需要的查询条件并不是主键,于是有了大家熟知的索引:非聚集索引,即是对表内任意字段进行索引的创建,数据库会重新备份这个字段的所有的值生成一棵儿叉平衡树,查询该列时,将从对应的二叉平衡树开始,查询到对应字段索引对应的主键,然后再根据主键查询到对应数据的值。

整理一下思路:

聚集索引,搜索主键生成的二叉平衡树,找到对应主键,根据主键找到数据;

非聚集索引,搜索索引字段生成的二叉平衡树,查找到对应字段值,查找到对应主键,根据主键找到数据;

在这里我们发现无论如何索引的树结构被查询完,结果都是对应着主键,也就是说索引是对应着主键的,主键才是对应着数据的唯一方式。

不过有一种情况叫做覆盖索引,可以避免主键对应索引的问题。

举个例子:我需要查找一个字段A的结果,但是我将B作为索引,那么这就是一个非聚集索引的流程:索引树-主键-主键对应的数据-这个数据A字段的值;

使用覆盖索引则是:我需要查找字段A的结果,将A,B联合作为索引,流程为:索引树-找到该索引,索引中相应的A的结果,不需要主键查询,结束。

上文中提到,索引建立时,每建立一个索引,数据库就会备份该字段建立一棵查询用的二叉树,这是不能多建立索引的原因之一,较占内存。

索引模型之所以是二叉平衡树涉及到时间复杂度的问题,有兴趣的可以自己学习。这里暂不做介绍。

建立索引后,做事务性操作时,所有索引树也要跟着调整,而二叉树虽然方便查询,但是每次重新排列并不方便,这也是不能多建立索引的原因之一。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值