今天一张 6000 万数据的表, 用了相同的 where 条件,结果出现了不同数量的数据集
1) 表结构: dbo.FctOrderSales
结构主键组成: OrderMonthKey, OrderDateKey, OrderKey, CustomerKey, CurrencyKey - ( Clustered Primary Key)
非结构索引: IX_FctOrderSales_PartitionID (non-clustered nonunique Key)
2) 查询语句:
Select * from dbo.FctOrderSales with(no lock) where PartitionID = 8
----------
(0) rows
Select count(1) from dbo.FctOrderSales with(no lock) where PartitionID = 8
Group by PartitionID
-----------
(1800000) rows
分析:
1) 当时有 10 个线程同时在使用这张表, 有 select, delete
2) 第一个 query 走了全表扫描,第二个 query 走了索引检索, clustered ( primary key ) table 与 non-clustered index 之间存在数据更新的时间差, clustered table 的数据已经全部被 delete 了, 但是 non-clustered index 的实际数据还没有被清理
如何证明, 接下来做实例层面的分析