数据库索引

最新推荐文章于 2024-01-07 15:45:48 发布

夏日千雪

最新推荐文章于 2024-01-07 15:45:48 发布

阅读量104

点赞数

分类专栏：数据库

本文链接：https://blog.csdn.net/beyondxiaohu15/article/details/80897980

版权

数据库专栏收录该内容

3 篇文章 0 订阅

订阅专栏

数据库的索引
问题抛出：
● 为什么要给表加上主键？
● 为什么加索引后会使查询变快？
● 为什么加索引后会使写入、修改、删除变慢？
● 什么情况下要同时在两个字段上建索引？
● 聚集索引和非聚集索引？

一般都会说索引像书的目录，通过书的目录就能找到需要的具体的内容。
通过目录查找书的内容自然是要比一页一页的翻书找来的快，这样也解释了一般加索引会使查询变快。

索引的原理离不开平衡树，b-tree，b+tree.有的数据库也使用哈希桶作用索引的数据结构，然而，主流的RDBMS都是把平衡树当做数据表默认的索引数据结构的。

如果给表上了主键，那么表在磁盘上的存储结构就由整齐排列的结构转变成了树状结构，也就是上面说的「平衡树」结构，换句话说，就是整个表就变成了一个索引。整个表变成了一个索引，也就是所谓的「聚集索引」。这就是为什么一个表只能有一个主键，一个表只能有一个「聚集索引」，因为主键的作用就是把「表」的数据格式转换成「索引（平衡树）」的格式放置。

其中树的所有结点（底部除外）的数据都是由主键字段中的数据构成，也就是通常我们指定主键的id字段。最下面部分是真正表中的数据。假如我们执行一个SQL语句：
select * from table where id = 1256;
首先根据索引定位到1256这个值所在的叶结点，然后再通过叶结点取到id等于1256的数据行。这里不讲解平衡树的运行细节，但是从上图能看出，树一共有三层，从根节点至叶节点只需要经过三次查找就能得到结果。

而树状结构查找，会减少很多IO开销，从而提升速度。

然而，事物都是有两面的，索引能让数据库查询数据的速度上升，而使写入数据的速度下降，原因很简单的，因为平衡树这个结构必须一直维持在一个正确的状态，增删改数据都会改变平衡树各节点中的索引数据内容，破坏树结构，因此，在每次数据改变时， DBMS必须去重新梳理树（索引）的结构以确保它的正确，这会带来不小的性能开销，也就是为什么索引会给查询以外的操作带来副作用的原因。

非聚集索引：
非聚集索引和聚集索引一样，同样是采用平衡树作为索引的数据结构。索引树结构中各节点的值来自于表中的索引字段，假如给user表的name字段加上索引，那么索引就是由name字段中的值构成，在数据改变时， DBMS需要一直维护索引结构的正确性。如果给表中多个字段加上索引，那么就会出现多个独立的索引结构，每个索引（非聚集索引）互相之间不存在关联。

联合主键。
//建立索引
create index index_birthday on user_info(birthday);
//查询生日在1991年11月1日出生用户的用户名
select user_name from user_info where birthday = ‘1991-11-1’
这句SQL语句的执行过程如下
首先，通过非聚集索引index_birthday查找birthday等于1991-11-1的所有记录的主键ID值
然后，通过得到的主键ID值执行聚集索引查找，找到主键ID值对就的真实数据（数据行）存储的位置
最后，从得到的真实数据中取得user_name字段的值返回，也就是取得最终的结果
我们把birthday字段上的索引改成双字段的覆盖索引
create index index_birthday_and_user_name on user_info(birthday, user_name);
这句SQL语句的执行过程就会变为
通过非聚集索引index_birthday_and_user_name查找birthday等于1991-11-1的叶节点的内容，然而，叶节点中除了有user_name表主键ID的值以外， user_name字段的值也在里面，因此不需要通过主键ID值的查找数据行的真实所在，直接取得叶节点中user_name的值返回即可。通过这种覆盖索引直接查找的方式，可以省略不使用覆盖索引查找的后面两个步骤，大大的提高了查询性能。

如何创建索引：
CREATE [UNIQUE] [CLUSTERED| NONCLUSTERED] INDEX <索引名>
ON <表名>(<列名>[ASC|DESC] [, <列名>[ASC|DESC]…])
说明：与表一样，索引也需要有唯一的名字，且基于一个表来建立，可以根据表中的一列或者多列，当列的顺序都是升序默认可不必标出，当属性列有按照降序排列的，所有属性的升序降序都不要标明。
UNIQUE——建立唯一索引。
CLUSTERED——建立聚集索引。
NONCLUSTERED——建立非聚集索引。
ASC——索引升序排序。
DESC——索引降序排序。

修改和删除索引：
ALTER INDEX <旧引索名字> RENAME TO<新引索名>
DROP INDEX 语句删除索引，其一般格式是：
DROP INDEX<索引名>

聚集索引就是在数据库被开辟一个物理空间存放他的排列的值，例如1-100，所以当插入数据时，他会重新排列整个整个物理空间，而非聚集索引其实可以看作是一个含有聚集索引的表，他只仅包含原表中非聚集索引的列和指向实际物理表的指针。他只记录一个指针，其实就有点和堆栈差不多的感觉了。

夏日千雪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据库索引

数据库的索引问题抛出： ● 为什么要给表加上主键？ ● 为什么加索引后会使查询变快？ ● 为什么加索引后会使写入、修改、删除变慢？ ● 什么情况下要同时在两个字段上建索引？ ● 聚集索引和一般都会说索引像书的目录，通过书的目录就能找到需要的具体的内容。通过目录查找书的内容自然是要比一页一页的翻书找来的快。...
复制链接

扫一扫

专栏目录