MSSQL调优实战一乱建聚集索引的后果

最新推荐文章于 2022-03-22 15:37:42 发布

weixin_34015860

最新推荐文章于 2022-03-22 15:37:42 发布

阅读量150

点赞数

文章标签：数据库

原文链接：http://www.cnblogs.com/perfectdesign/archive/2008/02/26/1082998.html

版权

针对某电信公司大型日志型数据库进行调优，通过去除无用的自增主键，改用堆表，并创建包含汇总字段的非聚集索引，成功将查询时间从45秒缩短至20秒。分享了在高数据量环境下，如何合理设计数据库结构以提高查询效率的经验。

摘要由CSDN通过智能技术生成

今天调优某电信的大型数据库，是一个日志型的表，其中有个自增列字段和时间（时间是每个小时小时来的，每个小时有大概23万条记录），以及点击次数等日志信息，数据量在4000万以上，sp_spaceused使用了大概2G多的磁盘空间。整个表没有分区。整个表都是插入查询，没有更新操作。
有一个基于时间字段上的时间段where范围选择，然后聚合找到某些类型的聚合值。
观察发现自增列字段就是一个摆设，没有任何作用，也不做任何表的外键，只是可能当时开发人员在设计表的时候就不管3721都来一个自增列主键，导致在对date字段上的非聚集索引扫描后，还需要去聚集索引树上seek一下，这下子就增加一个嵌套查询了。去掉表上的主键聚集索引，将表回归为堆，这样在非聚集索引扫描后直接就拿到RID找相应行了。
后来又想办法整了个date字段上的include索引，将要汇总的字段都加到非聚集索引上来，连RID查找都不要了。include虽然增加磁盘开销，但是速度上去很多，且没有针对索引的更新，不涉及索引拆分等费时操作，所以觉得还是值得。
最后优化结果，由45秒到20秒。
优化结果还比较满意，最后最重要的是因为IO始终将不下来，因为数据太多了。
不知道还有没有办法能想想的。
其实以前自己在设计数据库的时候也经常对表开始就来一个主键，而并没有考虑其实际意义，导致表的操作非常困难。
这个日志类型的表基本不需要自增主键字段，他不会根据某一日志ＩＤ范围来查找或者更新日志。

但在优化的时候有个问题觉得很奇怪：
４０００万的数据，查找其中的２万条，根据日期上的过滤，我想应该是一个嵌套的书签查询计划，结果看到ＭＳＳＱＬ给出的答案却是聚集索引扫描。４０００万比２万的数据，却宁愿表扫描而不愿意做嵌套？只有指定了使用非聚集索引后查询计划才改成嵌套的书签查询。
问问大家这个是为何呢？难道聚集索引扫描的ＩＯ更低？

转载于:https://www.cnblogs.com/perfectdesign/archive/2008/02/26/1082998.html