主键与聚集索引的区别

最新推荐文章于 2025-03-10 16:00:00 发布

zhangsuiwen

最新推荐文章于 2025-03-10 16:00:00 发布

阅读量2w

点赞数 3

分类专栏：数据库文章标签： sql server 数据库存储 null 引擎磁盘

数据库专栏收录该内容

6 篇文章

订阅专栏

有些人可能对主键和聚集索引有所混淆，其实这两个是不同的概念，下面是一个简单的描述。不想看绕口文字者，直接看两者的对比表。尤其是最后一项的比较。

主键（PRIMARY KEY ）

来自MSDN的描述：

表通常具有包含唯一标识表中每一行的值的一列或一组列。这样的一列或多列称为表的主键 (PK)，用于强制表的实体完整性。在创建或修改表时，您可以通过定义 PRIMARY KEY 约束来创建主键。

一个表只能有一个 PRIMARY KEY 约束，并且 PRIMARY KEY 约束中的列不能接受空值。由于 PRIMARY KEY 约束可保证数据的唯一性，因此经常对标识列定义这种约束。

如果为表指定了 PRIMARY KEY 约束，则 SQL Server 2005 数据库引擎将通过为主键列创建唯一索引来强制数据的唯一性。当在查询中使用主键时，此索引还可用来对数据进行快速访问。因此，所选的主键必须遵守创建唯一索引的规则。

创建主键时，数据库引擎会自动创建唯一的索引来强制实施 PRIMARY KEY 约束的唯一性要求。如果表中不存在聚集索引或未显式指定非聚集索引，则将创建唯一的聚集索引以强制实施 PRIMARY KEY 约束。

聚集索引

聚集索引基于数据行的键值在表内排序和存储这些数据行。每个表只能有一个聚集索引，因为数据行本身只能按一个顺序存储。

每个表几乎都对列定义聚集索引来实现下列功能：

可用于经常使用的查询。
提供高度唯一性。

两者的比较

下面是一个简单的比较表

	主键	聚集索引
用途	强制表的实体完整性	对数据行的排序，方便查询用
一个表多少个	一个表最多一个主键	一个表最多一个聚集索引
是否允许多个字段来定义	一个主键可以多个字段来定义	一个索引可以多个字段来定义

是否允许 null 数据行出现	如果要创建的数据列中数据存在null，无法建立主键。创建表时指定的 PRIMARY KEY 约束列隐式转换为 NOT NULL。	没有限制建立聚集索引的列一定必须 not null . 也就是可以列的数据是 null 参看最后一项比较
是否要求数据必须唯一	要求数据必须唯一	数据即可以唯一，也可以不唯一。看你定义这个索引的 UNIQUE 设置。（这一点需要看后面的一个比较，虽然你的数据列可能不唯一，但是系统会替你产生一个你看不到的唯一列）

创建的逻辑	数据库在创建主键同时，会自动建立一个唯一索引。如果这个表之前没有聚集索引，同时建立主键时候没有强制指定使用非聚集索引，则建立主键时候，同时建立一个唯一的聚集索引	如果未使用 UNIQUE 属性创建聚集索引，数据库引擎将向表自动添加一个四字节 uniqueifier 列。必要时，数据库引擎将向行自动添加一个 uniqueifier 值，使每个键唯一。此列和列值供内部使用，用户不能查看或访问。

参考：

下面这个帖子中大力的回复：
http://topic.csdn.net/t/20021212/16/1255429.html

关于主键，非聚集索引，聚集索引，看看好吗？！

您好，想请教一下您以下一些问题：聚集索引对范围查询比较有用，只要找到边界值所在的位置便可以确定所查询之目标范围，但是对于单个的查询是起不到多大作用的。
我的很多查询是单个产品代号的在线查询，所以最好以先后时间建立聚集索引，产品代号虽然是查询条件，但是这个代号的变化范围很大，经过很多测试后代号顺序很乱，如果用它建聚集所以，如果后提交的代号较小，需要在物理位置上插到已有数据的中间，那么他后面所有数据都要向后移位，每次都挪动很多数据其不是很费资源，还不如建个非聚集索引，毕竟插入动作的频率远远高于查询动作，而以提交时间建聚集索引遵循先来先到的原则，一般不需要挪动数据的，所以这样对于插入很频繁的操作要更好一些。
对于每次插入前都要检查唯一性的列是不是一定要建成主键。
是不是每张表必须有个聚集索引索引，如果我不指定聚集索引，那么它以什么样的顺序进行物理排列呢？是不是先来先到的原则，早提交的在前面，后提交的在后面，每次插入只是追加，不用去挪动很多数据？
那个填充因子从0到100，范围太大，并且我一点都不知道他的意义，不知道是做什么用的，能否给我个经验值？
文件组也没有理解，听您的意思，如果我存放数据的逻辑盘是由多个物理硬盘构成的，可以选择文件组来进行并行处理，可以提高性能。我的数据文件是放在多个硬盘组成的磁盘阵列中的，按理因该选文件组，但是好像只有一个primary可供选择，是否选这个就行了?

是不是所有表一定得有主键，我到底有没有必要为了建立主键而去建一个毫无意义的自增列？

我对这方面懂得很少，以上是对于几位热心人回复贴的理解，不知道对不对，麻烦您给解答一下，不甚感激，谢谢！

1 楼jaguarcts（xzh2000）

聚集索引对范围查询比较有用，只要找到边界值所在的位置便可以确定所查询之目标范围，但是对于单个的查询是起不到多大作用的。
----应该也起作用，你可以在查询分析器查执行路径

对于每次插入前都要检查唯一性的列是不是一定要建成主键。
是不是每张表必须有个聚集索引索引，如果我不指定聚集索引，那么它以什么样的顺序进行物理排列呢？是不是先来先到的原则，早提交的在前面，后提交的在后面，每次插入只是追加，不用去挪动很多数据？
----这个问题不一定，主要看你要达到的目的，不过作开发最好是每个表都要有主键，SQL中主键本身就是聚集索引

那个填充因子从0到100，范围太大，并且我一点都不知道他的意义，不知道是做什么用的，能否给我个经验值？
----如果每个块中数据都充满了，当新的更新使比原来的数据长度大，会使索引破
碎，如果数据更新多，填充因子要大一些，反之。。。

文件组也没有理解，听您的意思，如果我存放数据的逻辑盘是由多个物理硬盘构成的，可以选择文件组来进行并行处理，可以提高性能。我的数据文件是放在多个硬盘组成的磁盘阵列中的，按理因该选文件组，但是好像只有一个primary可供选择，是否选这个就行了?
----文件组是为了更方便管理表所用的，你可以创建很多的文件组，将文件分布在
不同的组，可以控制表放在某一个文件组。
如create table a_test(id decimal(8,2)) on [second]
表示a_test创建在second文件组中，而second在另一块硬盘上。




2 楼sky_blue（蓝天2007）

"毕竟插入动作的频率远远高于查询动作" 这样用聚集索引的确负作用大。
"对于每次插入前都要检查唯一性的列是不是一定要建成主键。"不一定，可以建立唯一性约束
"我到底有没有必要为了建立主键而去建一个毫无意义的自增列"
个人意见还是建上好

3 楼tj_dns（愉快的登山者）

1。聚集索引对于单个的查询比没有索引要起作用；
2。同意建立产品代号非聚集索引；
3。最好将每次插入前都要检查唯一性的列建成主键；便于查错；
4。不是每张表必须有个聚集索引，如果不指定聚集索引，是先来先到的原则；
5。60%，如果建立聚集索引，且总有中间索引插入，此值就要考虑小一些，留出空间来；但值太小，索引的层次就要增加，反过来会影响速度。
6。在磁盘阵列中的也可以建立多个文件，但意义不很大；
7。不是所有表一定得有主键，要看需要，自增列也是；

4 楼ToUpdate（老六）

5 楼pengdali（）

参考：
簇集索引=聚集索引:
聚集索引确定表中数据的物理顺序。聚集索引类似于电话簿，后者按姓氏排列数据。由于聚集索引规定数据在表中的物理存储顺序，因此一个表只能包含一个聚集索引。但该索引可以包含多个列（组合索引），就像电话簿按姓氏和名字进行组织一样。

聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后，便可以确保包含后续索引值的行在物理相邻。例如，如果应用程序执行的一个查询经常检索某一日期范围内的记录，则使用聚集索引可以迅速找到包含开始日期的行，然后检索表中所有相邻的行，直到到达结束日期。这样有助于提高此类查询的性能。同样，如果对从表中检索的数据进行排序时经常要用到某一列，则可以将该表在该列上聚集（物理排序），避免每次查询该列时都进行排序，从而节省成本。

非簇集索引:
非聚集索引与聚集索引一样有 B 树结构，但是有两个重大差别：

数据行不按非聚集索引键的顺序排序和存储。

非聚集索引的叶层不包含数据页。
相反，叶节点包含索引行。每个索引行包含非聚集键值以及一个或多个行定位器，这些行定位器指向有该键值的数据行（如果索引不唯一，则可能是多行）。

非聚集索引可以在有聚集索引的表、堆集或索引视图上定义。在 Microsoft® SQL Server™ 2000 中，非聚集索引中的行定位器有两种形式：

如果表是堆集（没有聚集索引），行定位器就是指向行的指针。该指针用文件标识符 (ID)、页码和页上的行数生成。整个指针称为行 ID。

如果表没有聚集索引，或者索引在索引视图上，则行定位器就是行的聚集索引键。如果聚集索引不是唯一的索引，SQL Server 2000 将添加在内部生成的值以使重复的键唯一。用户看不到这个值，它用于使非聚集索引内的键唯一。SQL Server 通过使用聚集索引键搜索聚集索引来检索数据行，而聚集索引键存储在非聚集索引的叶行内。
由于非聚集索引将聚集索引键作为其行指针存储，因此使聚集索引键尽可能小很重要。如果表还有非聚集索引，请不要选择大的列作为聚集索引的键。

唯一索引:
唯一索引可以确保索引列不包含重复的值。在多列唯一索引的情况下，该索引可以确保索引列中每个值组合都是唯一的。
唯一索引既是索引也是约束。

复合索引：
索引项是多个的就叫组合索引，也叫复合索引。
复合索引使用时需要注意索引项的次序。