SQL Server统计信息剖析讲解

Xx震zZ

于 2023-07-12 15:39:24 发布

阅读量578

点赞数 1

文章标签：数据库 java 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49668551/article/details/131683128

版权

查询优化的统计信息是一些对象，这些对象包含与值在表或索引视图的一列或多列中的分布有关的统计信息。查询优化器使用这些统计信息来估计查询结果中的基数或行数。通过这些基数估计，查询优化器可以创建高质量的查询计划。例如，查询优化器可以使用基数估计选择索引查找运算符而不是耗费更多资源的索引扫描运算符，从而提高查询性能。

其实关于统计信息的作用通俗点将就是：SQL Server通过统计信息理解库中每张表的数据内容项分布，知道里面数据“心中有数”，这样每次查询语句的时候就可以根据表中的数据分布，基本能定位到要查找数据的内容位置。

比如，我记得我以前有篇文章写过一个相同的查询语句，但是产生了完全不同的查询计划，这里回顾下，基本如下：

SELECT * FROM Person.Contact

WHERE FirstName LIKE 'K%'

SELECT * FROM Person.Contact

WHERE FirstName LIKE 'Y%'

完全相同的查询语句，只是查询条件不同，一个查找以K开头的顾客，一个查找以Y开头的顾客，却产生了完全不同的查询计划。

其实，这里的原因就是统计信息在作祟。

我们知道，在这张表的FirstName字段存在一个非聚集索引，目标就是为了提升如上面的查询语句的性能。

但是这张表里面FirstName字段中的数据内容以K开头的顾客存在1255行，也就是如果利用非聚集索引查找的方式，需要产生1225次IO操作，这可能不是最糟的，糟的还在后面，因为我们获取的数据字段并不全部在FirstName字段中，而需要额外的书签查找来获取，而这个书签查找会产生的大量的随机IO操作。记住：这里是随机IO。

所以相比利用非聚集索引所带来的消耗相比，索引扫描来的更划算，因为它依次扫描就可以获取想要的数据。

而以Y开头的就只有37行，37行数据完全通过非聚集索引获取，再加一部分的书签查找很显然是一个很划算的方式。因为它数据量少，产生的随机IO量相对也会少。

所以，这里的问题来了：

SQL Server是如何知道这张表里FirstName字段中以K开头的顾客会比较多，而以Y开头反而少呢？。

这里就是统计信息在作祟了，它不但知道FirstName字段中各行数据的内

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
SQL Server统计信息剖析讲解

查询优化的统计信息是一些对象，这些对象包含与值在表或索引视图的一列或多列中的分布有关的统计信息。查询优化器使用这些统计信息来估计查询结果中的基数或行数。通过这些基数估计，查询优化器可以创建高质量的查询计划。例如，查询优化器可以使用基数估计选择索引查找运算符而不是耗费更多资源的索引扫描运算符，从而提高查询性能。
复制链接

扫一扫

Xx震zZ CSDN认证博客专家 CSDN认证企业博客

码龄4年

21: 原创

1万+: 周排名

5万+: 总排名

4万+: 访问

: 等级

410: 积分

1596: 粉丝

192: 获赞

20: 评论

311: 收藏

私信

关注

热门文章

最新评论

麒麟（Kylin）系统下安装MySQL数据库（离线版）
Xx震zZ: 你细看一下教程，一开始就下载好了
麒麟（Kylin）系统下安装MySQL数据库（离线版）
m0_71206099: 4.1 缺少依赖。我想知道不连我的情况下怎么去下载依赖网上根本搜不到教程都是联网下载依赖
聚合函数与分组数据
CSDN-Ada助手: 恭喜用户写了第20篇博客！看到您深入探讨聚合函数和分组数据的文章，让我受益匪浅。希望您能继续保持创作的热情和耐心，不断学习和提升自己的写作水平。或许下一步可以尝试结合实际案例进行分析，或者深入探讨某一特定聚合函数的使用技巧，让读者更加易懂和实用。期待您的更多精彩作品！
SQL函数（行函数）的使用
CSDN-Ada助手: 恭喜您发布了关于SQL函数的新博客！不断学习并分享知识是非常值得称赞的。希望您能继续保持创作的热情，探索更多SQL函数的使用方法，或者可以尝试结合实际案例进行分析，让读者更好地理解和运用这些函数。期待您未来更多精彩的文章！祝您创作顺利，不断进步！
SQL Server的存储过程和自定义函数
CSDN-Ada助手: 恭喜您写了这么一篇精彩的博客，对于SQL Server的存储过程和自定义函数进行了深入的探讨，让读者受益匪浅。希望您能继续保持创作的热情，可以考虑深入研究SQL Server的性能优化或者高级应用场景，相信会有更多精彩的文章呈现给我们。期待您的下一篇作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。