聚集索引和非聚集索引的区别，何时创建索引

最新推荐文章于 2024-07-25 07:07:02 发布

张珂靖

最新推荐文章于 2024-07-25 07:07:02 发布

阅读量1.2k

点赞数

分类专栏：索引

索引专栏收录该内容

2 篇文章 0 订阅

订阅专栏

use test
go
表创建
create table aclu
(
A int not null,
B char(10),
C varchar(10)
)
go
插入数据
insert into aclu
select 1,'B','C'
union
select 5,'B','C'
union
select 7,'B','C'
union
select 9,'B','C'
go

创建聚集索引
create clustered index CLU_ABC
on aclu(A)
GO

sp_helpIndex aclu

insert into aclu
values(3,'B','C')

select * from aclu

创建非聚集索引
Drop index aclu.CLU_ABC

create nonclustered index NONCLU_ABC
on aclu(A)

insert into aclu
values(6,'B','C')

结论：

A B C
1 B C
3 B C
5 B C
7 B C
9 B C
6 B C

聚集索引插入3，按顺序

非聚集索引插入6，不按顺序

其实，我们的汉语字典的正文本身就是一个聚集索引。

比如，我们要查“安”字，就会很自然地翻开字典的前几页，因为“安”的拼音是“an”，而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的，那么“安”字就自然地排在字典的前部。如果您翻完了所有以“a”开头的部分仍然找不到这个字，那么就说明您的字典中没有这个字；同样的，如果查“张”字，那您也会将您的字典翻到最后部分，因为“张”的拼音是“zhang”。也就是说，字典的正文部分本身就是一个目录，您不需要再去查其他目录来找到您需要找的内容。我们把这种正文内容本身就是一种按照一定规则排列的目录称为“聚集索引”。

　如果您认识某个字，您可以快速地从自动中查到这个字。但您也可能会遇到您不认识的字，不知道它的发音，这时候，您就不能按照刚才的方法找到您要查的字，而需要去根据“偏旁部首”查到您要找的字，然后根据这个字后的页码直接翻到某页来找到您要找的字。但您结合“部首目录”和“检字表”而查到的字的排序并不是真正的正文的排序方法，比如您查“张”字，我们可以看到在查部首之后的检字表中“张”的页码是672页，检字表中“张”的上面是“驰”字，但页码却是63页，“张”的下面是“弩”字，页面是390页。很显然，这些字并不是真正的分别位于“张”字的上下方，现在您看到的连续的“驰、张、弩”三字实际上就是他们在非聚集索引中的排序，是字典正文中的字在非聚集索引中的映射。我们可以通过这种方式来找到您所需要的字，但它需要两个过程，先找到目录中的结果，然后再翻到您所需要的页码。我们把这种目录纯粹是目录，正文纯粹是正文的排序方式称为“非聚集索引”。

聚集索引和非聚集索引的区别

两者最大的区别在于聚集索引的叶级存储了数据本身，但非聚集索引叶结点不存在数据记录，只是一个指向聚集索引的指针。这就意味着在非聚集索引的所有级别中都包含了聚集索引的指针，聚集索引的大小会直接影响非聚集索引的大小。

如何选择表的聚集索引

一般可以优先参考如下因素：
1.列数据宽度要小或者叫窄列，比如int就只有4字节，这个宽度越小越好，因为可以在同样的空间中存储更多的索引数据
2.唯一性，虽然聚集索引并没强制要求列字段是唯一的，但在系统内部会在具备有重复值的列上增加一个标识位来区分，实际内部还是唯一的，所以尽量选择重复值很少最好是3.没有重复值的列，因为SQL Sever要额外的去维护这些标识
4.静态的，不易更改的列，很少发生变更最好是从不修改这列的值，因为它也许会引起数据的移动
5.递增性的，用来避免索引碎片，这样SQL Server每次在插入数据的时候都会将新记录追加在最新一条记录的后面，不会因此影响之前插入的数据顺序。

什么情况下应不建或少建索引

动作描述

列经常被分组排序

返回某范围内的数据

一个或极少不同值

小数目的不同值

大数目的不同值

频繁更新的列

外键列

主键列

频繁修改索引列

使用聚集索引

应

不应

应

不应

应

不应

使用非聚集索引

应

不应

应

1.表记录太少，如果一个表只有5条记录，采用索引去访问记录的话，那首先需访问索引表，再通过索引表访问数据表，一般索引表与数据表不在同一个数据块，这种情况下ORACLE至少要往返读取数据块两次。而不用索引的情况下ORACLE会将所有的数据一次读出，处理速度显然会比用索引快。

2.经常插入、删除、修改的表，对一些经常处理的业务表应在查询允许的情况下尽量减少索引，如zl_yhbm，gc_dfss，gc_dfys，gc_fpdy等业务表。

3.数据重复且分布平均的表字段，假如一个表有10万行记录，有一个字段A只有T和F两种值，且每个值的分布概率大约为50%，那么对这种表A字段建索引一般不会提高数据库的查询速度。

4.经常和主字段一块查询但主字段索引值比较多的表字段，如gc_dfss（电费实收）表经常按收费序号、户标识编号、抄表日期、电费发生年月、操作标志来具体查询某一笔收款的情况，如果将所有的字段都建在一个索引里那将会增加数据的修改、插入、删除时间，从实际上分析一笔收款如果按收费序号索引就已经将记录减少到只有几条，如果再按后面的几个字段索引查询将对性能不产生太大的影响。