第12课:统计信息

本文深入探讨数据库统计信息在物理优化中的作用,包括数据分布、IO和CPU代价的量化以及执行计划的影响。重点介绍了PostgreSQL的统计信息类型,如高频值、直方图、相关系数,以及多列统计信息。通过统计分析,优化器能够更精确地计算查询代价,提升SQL执行效率。
摘要由CSDN通过智能技术生成

从这一节课开始就进入了物理优化的部分。所谓物理优化就是通过计算代价的方式来对多种可能的方法进行筛选,优胜劣汰。那么什么是代价呢?代价就是一个执行计划在执行过程中所带来的消耗。既然是数据库,数据都保存在磁盘上,那么就免不了读取磁盘带来的消耗,这种消耗可以称为 IO 代价。在 SQL 语句中需要执行各种表之间做逻辑运算,看到“运算”两个字就很容易想到 CPU,因为 CPU 是中央处理单元,所以执行计划还要考虑 CPU 代价。由于分布式计划(或者并行执行计划)对数据进行了切分,导致在执行计划之间需要传递数据,因此还需要考虑通信代价

那么问题来了,这些代价如何计算呢?当然可以采用最简单的“拍脑袋大法”,比如在路径选择的时候我们就喜欢记住这样的模糊的概念:通过建索引的方式可以提高查询速度。基于此,在打算提高查询性能的时候,一拍脑袋就在一个表上建上百个索引,美其名曰用空间换时间,除了更新和插入的速度慢一点,简直没毛病。

但优化器的代价模型不满足于这种含糊其辞式概念,需要做“精确”的计算,于是就需要如下几个方面的信息。

  • 数据到底是什么情况?也就是说数据的分布情况,比如它占了多少个页面,有多少个元组,元组的宽度是多少&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值