谈一谈聚集索引和非聚集索引，自身提升

最新推荐文章于 2024-08-04 17:50:08 发布

shmily_sjq

最新推荐文章于 2024-08-04 17:50:08 发布

阅读量445

点赞数

分类专栏：数据库文章标签：索引数据库

本文链接：https://blog.csdn.net/shmily_sjq/article/details/106944864

版权

数据库专栏收录该内容

2 篇文章 0 订阅

订阅专栏

聚集索引

聚集索引是指数据库表行中数据的物理顺序与键值的逻辑（索引）顺序相同。一个表只能有一个聚集索引。因为一个表的物理顺序只有一种情况，所以，对应的聚集索引只能有一个。如果某索引不是聚集索引，则表中的行物理顺序与索引顺序不匹配，与非聚集索引相比，聚集索引有着更快的检索速度。

基本介绍编辑：
聚集索引是一种索引，该索引中键值的逻辑顺序决定了表中相应行的物理顺序。

聚集索引也称为聚簇索引（Clustered Index），聚类索引，簇集索引。同样，非聚集索引也称为非聚簇索引，非聚类索引，非簇集索引。

聚集索引确定表中数据的物理顺序。聚集索引类似于电话簿，按姓氏排列数据。由于聚集索引规定数据在表中的物理存储顺序，因此一个表只能包含一个聚集索引。但该索引可以包含多个列（组合索引），就像电话簿按姓氏和名字进行组织一样。

聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后，便可以确保包含后续索引值的行在物理相邻。例如，如果应用程序执行的一个查询经常检索某一日期范围内的记录，则使用聚集索引可以迅速找到包含开始日期的行，然后检索表中所有相邻的行，直到到达结束日期。这样有助于提高此类查询的性能。同样，如果对从表中检索的数据进行排序时经常要用到某一列，则可以将该表在该列上聚集（物理排序），避免每次查询该列时都进行排序，从而节省成本。

当索引值唯一时，使用聚集索引查找特定的行也很有效率。例如，使用唯一雇员 ID 列 emp_id 查找特定雇员的最快速的方法，是在 emp_id 列上创建聚集索引或 PRIMARY KEY 约束。

适用情况
1、含有大量非重复值的列。
2、使用BETWEEN , > , >= , <或<=返回一个范围值的列
3、被连续访问的列
4、返回大型结果集的查询
5、经常被使用连接或GROUP BY子句的查询访问的列

使用注意事项
注意事项定义聚集索引键时使用的列越少越好，这一点很重要。如果定义了一个大型的聚集索引键，则同一个表上定义的任何非聚集索引都将增大许多，因为非聚集索引条目包含聚集键。当把 SQL 脚本保存到可用空间不足的磁盘上时，索引优化向导不返回错误。有关 Microsoft® SQL Server™ 2000 中如何实现非聚集索引的更多信息，请参见非聚集索引。
在分析过程中，索引优化向导会消耗相当多的 CPU 及内存资源。最好在生产服务器的测试版上执行优化，而不要在生产服务器上执行。此外，最好在另一台计算机上而非运行 SQL Server 的计算机上运行该向导。该向导不能用于在 SQL Server 6.5 版或更早版本的数据库中选择或创建索引及统计信息。
在创建聚集索引之前，应先了解您的数据是如何被访问的。

对 ORDER BY 或 GROUP BY 子句中指定的列进行索引，可以使 SQL Server 不必对数据进行排序，因为这些行已经排序。这样可以提高查询性能。OLTP类型的应用程序，这些程序要求进行非常快速的单行查找（一般通过主键）。应在主键上创建聚集索引。
聚集索引不适用于：频繁更改的列这将导致整行移动。因为 SQL Server 必须按物理顺序保留行中的数据值。这一点要特别注意，因为在大数据量事务处理系统中数据是易失的。宽键来自聚集索引的键值由所有非聚集索引作为查找键使用，因此存储在每个非聚集索引的叶条目内。

非聚集索引：

该索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。一般我们建立的索引都是非聚集索引。

非聚集索引的查询方式和聚集索引的查询方式不一样。聚集索引找到符合条件的目标即获得该目标行的所有数据，因为直接找到是他的物理地址。非聚集索引则不一样，如果你查询的字段是非聚集索引的一部分。那么因为索引本身包含的就有相应数据就可以直接返回，但是如果你查的数据包含非索引数据，比如你用了select *，那么通过非聚集索引找到目标之后，目标体会有一个目标数据聚集索引的key,会通过这个key再通过聚集索引找到完整的目标数据。也就是说使用非聚集索引且要查询的列不包含非聚集索引列本身，那么要经过二次查询。一次查询获得聚集索引的key,二次通过key与聚集索引确定目标数据。有点像新华字段偏旁查询，但是查到字没标页数只标了读音，如果你仅仅查这字怎么写或者读什么，那么直接通过偏旁这个部分的数据即可，但是如果要查更详细的，就要通过拼音去拼音目录里面找，确定页数再去指定页获得具体数据了。当然这只是打个比喻，因为字典里面偏旁查到的字也会表明页数的。非聚集索引适合建立在大数据量下且有大数目不同值，即列中大部分值都互不相同的情况。

数据行不按非聚集索引键的顺序排序和存储。非聚集索引的叶层不包含数据页。相反，叶节点包含索引行。每个索引行包含非聚集键值以及一个或多个行定位器，这些行定位器指向有该键值的数据行（如果索引不唯一，则可能是多行）。 非聚集索引可以在有聚集索引的表、堆集或索引视图上定义。在 Microsoft® SQL Server™ 2000 中，非聚集索引中的行定位器有两种形式：
如果表是堆集（没有聚集索引），行定位器就是指向行的指针。该指针用文件标识符 (ID)、页码和页上的行数生成。整个指针称为行 ID。如果表有聚集索引，或者索引在索引视图上，则行定位器就是行的聚集索引键。如果聚集索引不是唯一的索引，SQL Server 2000 将添加在内部生成的值以使重复的键唯一。用户看不到这个值，它用于使非聚集索引内的键唯一。SQL Server 通过使用聚集索引键搜索聚集索引来检索数据行，而聚集索引键存储在非聚集索引的叶行内。由于非聚集索引将聚集索引键作为其行指针存储，因此使聚集索引键尽可能小很重要。如果表还有非聚集索引，请不要选择大的列作为聚集索引的键。

下面的表总结了何时使用聚集索引或非聚集索引：
在这里插入图片描述