索引原理 - [技术研究]
实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:
1.聚集索引
其实,我们的汉语字典的正文本身就是一个聚集索引。比如,我们要查“安”字,就会很自然地翻开字典的前几页,因为“安”的拼音是“an.
字典的正文部分本身就是一个目录,您不需要再去查其他目录来找到您需要找的内容。
我们把这种正文内容本身就是一种按照一定规则排列的目录称为“聚集索引”。
2.非聚集索引
如果您认识某个字,您可以快速地从自动中查到这个字。但您也可能会遇到您不认识的字,不知道它的发音,这时候,您就不能按照刚才的方
法找到您要查的字,而需要去根据“偏旁部首”查到您要找的字,然后根据这个字后的页码直接翻到某页来找到您要找的字。但您结合“部首
目录”和“检字表”而查到的字的排序并不是真正的正文的排序方法,比如您查“张”字,我们可以看到在查部首之后的检字表中“张”的页
码是672页,检字表中“张”的上面是“驰”字,但页码却是63页,“张”的下面是“弩”字,页面是390页。很显然,这些字并不是真正的分
别位于“张”字的上下方,现在您看到的连续的“驰、张、弩”三字实际上就是他们在非聚集索引中的排序,是字典正文中的字在非聚集索引
中的映射。我们可以通过这种方式来找到您所需要的字,但它需要两个过程,先找到目录中的结果,然后再翻到您所需要的页码。
我们把这种目录纯粹是目录,正文纯粹是正文的排序方式称为“非聚集索引”。
通过以上例子,我们可以理解到什么是“聚集索引”和“非聚集索引”。
二。实例分析:
下面我们就来看一下在200万条数据量的情况下各种查询的速度表现(以25万条数据为例说明)
create database index_Test1 --创建测试用的索引数据库
GO
use index_Test1
GO
create table IndexTable1
(
gid int identity(1,1) primary key,
data datetime,
creater varchar(100) not null,
title varchar(100) not null,
)
--插入数据
declare @i int
set @i=1
while @i<=2000000
begin
insert into IndexTable1(data,creater,title) values(DATEADD(day, @i, getdate()),'mfm','这是测试索引的例子')
set @i=@i+1
end
--默认情况下查询前250000条数据的时间
declare @timediff datetime
select @timediff=getdate()
select top 250000 * from IndexTable1
select datediff(ms,@timediff,GetDate()) as 耗时
--在主键上建立聚集索引,在data上建立非聚集索引(非常慢)
create CLUSTERED index gid_index on IndexTable1(data)
--也可以利用以下方法修改主健为非聚集索引
alter table IndexTable1 add constraint pk_dr primary key nonclustered(gid)
--删除已存在的索引
drop index IndexTable1.gid_index
经过测试,总结如下:
1.在默认情况下,即以gid为主健时,系统自动生成聚集索引,查询25w数据花了3382ms
2.以gid为主健聚集索引,data建立为非聚集索引时,查询25w数据花了5586ms
3.取消主健取集索引,建立data为取集索引时,查询25w数据花了2274ms