聚集索引更新后会不会马上重新排序
今天在QQ群里有人问到下面问题
提问人用的是MYSQL,不过这个问题让我想起了SQLSERVER的万圣节问题
万圣节问题就是因为更新了非聚集索引之后,非聚集索引迅速排序导致的更新错误问题
当时我只是测试了非聚集索引下面的情况,但是聚集索引下面有没有这种情况呢?
我们修改一下
使用下面SQL脚本建立测试环境
1 USEmaster2 GO
3 CREATE DATABASESpool4 GO
5
6 USE [Spool]
7 GO
8
9
10 --建表
11 CREATE TABLEHalloween12 (13 ID INT IDENTITY(1, 1),14 Name VARCHAR(30) ,15 Salary NUMERIC(18, 2),16 Remark NVARCHAR(3000)17 )18 GO
19
20 --插入数据
21 INSERT INTO [dbo].[Halloween] ( [Name], [Salary], [Remark])22 SELECT '小明',1,replicate('a', 3000) UNION ALL
23 SELECT '小方',2,replicate('a', 3000)24
25
26
27
28 --建立聚集索引
29 CREATE CLUSTERED INDEX ix_Halloween ON Halloween(Salary ASC,[name])30 GO
31
32 --查询
33 SELECT * FROMHalloween34 GO
View Code
我们用下面SQL语句看一下聚集索引页面
1 CREATE TABLEDBCCResult (2 PageFID NVARCHAR(200),3 PagePID NVARCHAR(200),4 IAMFID NVARCHAR(200),5 IAMPID NVARCHAR(200),6 ObjectID NVARCHAR(200),7 IndexID NVARCHAR(200),8 PartitionNumber NVARCHAR(200),9 PartitionID NVARCHAR(200),10 iam_chain_type NVARCHAR(200),11 PageType NVARCHAR(200),12 IndexLevel NVARCHAR(200),13 NextPageFID NVARCHAR(200),14 NextPagePID NVARCHAR(200),15 PrevPageFID NVARCHAR(200),16 PrevPagePID NVARCHAR(200)17 )18
19 --TRUNCATE TABLE [dbo].[DBCCResult]
20 INSERT INTO DBCCResult EXEC ('DBCC IND(spool,Halloween,-1)')21
22 SELECT * FROM [dbo].[DBCCResult] ORDER BY [PageType] DESC
View Code
聚集索引页面
1 DBCC TRACEON(3604,-1)2 GO
3 DBCC PAGE(spool,1,174,3)4 GO
View Code
我们update一下Salary等于1的那位员工的工资
1 UPDATE Halloween SET Salary = 2.5
2 FROMHalloween3 WHERE Salary =1
再看一下聚集索引页面
可以看到SQLSERVER增加了页面89来保存结果,就是说聚集索引也是在更新之后马上排序的
那么页面89和页面109里面到底有什么内容呢?
1 DBCC TRACEON(3604,-1)2 GO
3 DBCC PAGE(spool,1,109,3)4 GO
View Code
数据页面109
1 PAGE: (1:109)2
3
4
5 UNIQUIFIER = [NULL]
6
7 Slot 0 Column 1 Offset 0x4 Length 9
8
9 Salary = 1.00
10
11 Slot 0 Column 2 Offset 0x1c Length 4
12
13 Name =小明14
15 Slot 0 Column 3 Offset 0xd Length 4
16
17 ID = 1
18
19 Slot 0 Column 4 Offset 0x20 Length 6000
20
21 Remark = aaaa
数据页面89
1 DBCC TRACEON(3604,-1)2 GO
3 DBCC PAGE(spool,1,89,3)4 GO
View Code
1 PAGE: (1:89)2
3 Slot 0 Column 1 Offset 0x4 Length 9
4
5 Salary = 2.50
6
7 Slot 0 Column 2 Offset 0x1c Length 4
8
9 Name =小明10
11 Slot 0 Column 3 Offset 0xd Length 4
12
13 ID = 1
14
15 Slot 0 Column 4 Offset 0x20 Length 6000
16
17 Remark = aaa
大家马上会问:为什麽109这个页面不删除他,还存放着旧的记录,留在那里占用空间???
除非你重组聚集索引或者重建聚集索引,不然的话SQLSERVER不会马上删除页面的
当你又插入一条记录,并且这条记录的Salary小于2,那么SQLSERVER就会把这条记录保存到109这个页面
1 INSERT INTO [dbo].[Halloween] ( [Name], [Salary], [Remark])2 SELECT '小新',1,replicate('a', 3000)
看一下Halloween表的页面分配情况
还是那几个页面,没有变化
现在看一下109这个页面
1 DBCC TRACEON(3604,-1)2 GO
3 DBCC PAGE(spool,1,109,3)4 GO
View Code
1 PAGE: (1:109)2
3
4 UNIQUIFIER = [NULL]
5
6 Slot 0 Column 1 Offset 0x4 Length 9
7
8 Salary = 1.00
9
10 Slot 0 Column 2 Offset 0x1c Length 4
11
12 Name =小新13
14 Slot 0 Column 3 Offset 0xd Length 4
15
16 ID = 3
17
18 Slot 0 Column 4 Offset 0x20 Length 6000
19
20 Remark = aaa
关于第一张图片的结果
堆表脚本
1 CREATE TABLEHalloween22 (3 ID INT,4 Name VARCHAR(30) ,5 Salary NUMERIC(18, 2),6 Remark NVARCHAR(3000)7 )8 GO
9
10 --插入数据
11 INSERT INTO [dbo].[Halloween2] ([id] ,[Name], [Salary], [Remark])12 SELECT 1, '小明',2,replicate('a', 3000) UNION ALL
13 SELECT 2, '小方',3,replicate('a', 3000)14
15
16
17
18
19 --查询
20 SELECT * FROMHalloween221 GO
22
23 UPDATEHalloween224 SET Salary = id ,[id] =salary25
26 --查询
27 SELECT * FROMHalloween228 GO
View Code
更新时候的执行计划
聚集索引表脚本
1 CREATE TABLEHalloween32 (3 ID INT,4 Name VARCHAR(30) ,5 Salary NUMERIC(18, 2),6 Remark NVARCHAR(3000)7 )8 GO
9
10 --插入数据
11 INSERT INTO [dbo].[Halloween3] ([id] ,[Name], [Salary], [Remark])12 SELECT 1, '小明',2,replicate('a', 3000) UNION ALL
13 SELECT 2, '小方',3,replicate('a', 3000)14
15 --建立聚集索引
16 CREATE CLUSTERED INDEX ix_Halloween ON Halloween3(Salary ASC,[name])17 GO
18
19
20
21 --查询
22 SELECT * FROMHalloween323 GO
24
25 UPDATEHalloween326 SET Salary = id ,[id] =salary27
28 --查询
29 SELECT * FROMHalloween330 GO
View Code
更新时候的执行计划
非聚集索引表脚本
1 CREATE TABLEHalloween42 (3 ID INT,4 Name VARCHAR(30) ,5 Salary NUMERIC(18, 2),6 Remark NVARCHAR(3000)7 )8 GO
9
10 --插入数据
11 INSERT INTO [dbo].[Halloween4] ([id] ,[Name], [Salary], [Remark])12 SELECT 1, '小明',2,replicate('a', 3000) UNION ALL
13 SELECT 2, '小方',3,replicate('a', 3000)14
15 --建立非聚集索引
16 CREATE NONCLUSTERED INDEX ix_Halloween ON Halloween4(Salary ASC,[name])17 GO
18
19
20
21 --查询
22 SELECT * FROMHalloween423 GO
24
25 UPDATEHalloween426 SET Salary = id ,[id] =salary27
28 --查询
29 SELECT * FROMHalloween430 GO
View Code
更新时候的执行计划
总结
聚集索引也会引起万圣节问题
万圣节问题:重新排序导致的更新记录错误
聚集索引更新了之后也会重新排序,所以你看到上面聚集索引表的结果
中间也会有一个表假脱机的运算符
而非聚集索引的执行计划为什麽没有呢?
因为非聚集索引那个扫描的是堆里的数据页面,而不是扫描非聚集索引页面,
只有扫描非聚集索引页面才会出现万圣节问题,更新了非聚集索引之后马上进行排序
而堆里的数据页面无论怎麽更新都不会重新排序的
这里归纳一下重新排序的情况
重新排序:扫描聚集索引(聚集索引表)、扫描非聚集索引(非聚集索引表)
不重新排序:扫描堆里的数据页面(非聚集索引表)、堆表
非聚集索引比较特殊,因为索引页面和数据页面是分开的,所以要分两种情况
如有不对的地方,欢迎大家拍砖o(∩_∩)o