聚簇索引和非聚簇索引探讨

在《数据库原理》里面,对聚簇索引的解释是:聚簇索引的顺序就是数据的物理存储顺序,而对非聚簇索引的解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚簇索引。

不过这个定义太抽象了。在SQL Server中,索引是通过二叉树的数据结构来描述的,我们可以这么理解聚簇索引:索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点,只不过有一个指针指向对应的数据块。

现在可以讨论聚簇索引与非聚簇索引的本质区别了。

正如本文最前面的两个图所示,聚簇索引的叶节点就是数据节点,而非聚簇索引的页节点仍然是索引检点,并保留一个链接指向对应数据块。

还是通过一道数学题来看看它们的区别吧:假设有一8000条记录的表,表中每条记录在磁盘上占用1000字节,如果在一个10字节长的字段上建立非聚簇索引主键,需要二叉树节点16000个(这16000个节点中有8000个叶节点,每个页节点都指向一个数据记录),这样数据将占用8000条×1000字节/8K字节=1000个页面;索引将占用16000个节点×10字节/8K字节=20个页面,共计1020个页面。

同样一张表,如果我们在对应字段上建立聚簇索引主键,由于聚簇索引的页节点就是数据节点,所以索引节点仅有8000个,占用10个页面,数据仍然占有1000个页面。

下面我们看看在执行插入操作时,非聚簇索引的主键为什么比聚簇索引主键要快。主键约束要求主键不能出现重复,那么SQL Server是怎么知道不出现重复的呢?唯一的方法就是检索。对于非聚簇索引,只需要检索20个页面中的16000个节点就知道是否有重复,因为所有主键键值在这16000个索引节点中都包含了。但对于聚簇索引,索引节点仅仅包含了8000个中间节点,至于会不会出现重复必须检索另外1000个页数据节点才知道,那么相当于检索10+1000=1010个页面才知道是否有重复。所以聚簇索引主键的插入速度要比非聚簇索引主键的插入速度慢很多。

让我们再来看看数据检索的效率,如果对上述两表进行检索,在使用索引的情况下(有些时候SQL Server执行计划会选择不使用索引,不过我们这里姑且假设一定使用索引),对于聚簇索引检索,我们可能会访问10个索引页面外加1000个数据页面得到结果(实际情况要比这个好),而对于非聚簇索引,系统会从20个页面中找到符合条件的节点,再映射到1000个数据页面上(这也是最糟糕的情况),比较一下,一个访问了1010个页面而另一个访问了1020个页面,可见检索效率差异并不是很大。所以不管非聚簇索引也好还是聚簇索引也好,都适合排序,聚簇索引仅仅比非聚簇索引快一点。


引自:http://www.cnblogs.com/zhenyulu/articles/25794.html


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
聚簇索引聚簇索引是数据库中两种不同的索引类型,它们的区别主要体现在数据的组织方式和索引访问的效果上。 聚簇索引是一种按照索引键的顺序来组织中数据的方法。在一个中只能有一个聚簇索引,因此每个只能按照一种方式进行组织。聚簇索引的叶节点包含了中的数据行,数据行按照聚簇索引键的顺序存储在磁盘上,相邻的数据行通常也会存储在相邻的物理块上。由于聚簇索引决定了数据的物理存储顺序,因此对于按照聚簇索引键进行查询时,可以获得较好的性能。 聚簇索引是一种单独存放索引数据和数据的方法。在一个中可以有多个聚簇索引,每个聚簇索引都有一个独立的叶节点,叶节点中包含了索引键和指向对应数据行的指针。由于聚簇索引数据是分开存储的,因此它们之间的物理存储顺序没有直接关联。当使用聚簇索引进行查询时,需要先通过索引找到对应的指针,再根据指针找到对应的数据行。相比于聚簇索引聚簇索引的查询性能通常较低。 总结起来,聚簇索引聚簇索引的区别主要有两点:数据的组织方式和索引访问的效果。聚簇索引按照索引键的顺序组织数据,适合按照聚簇索引键进行查询;聚簇索引数据分开存储,查询时需要通过索引键找到对应的指针再找到数据行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值