Oracle中,统计信息对于SQL优化是非常重要的。Oracle默认的统计信息是非常具有局限性的,当系统自动搜集的默认统计信息不能满足SQL优化需求时,我们需要手动进行统计信息的收集。
Oracle统计信息搜集主要通过以下两种方式实现:
1.ANALYZE命令
2.DBMS_STATS包
由于ANALYZE搜集的统计信息比较粗糙,所以推荐使用DBMS_STATS包进行统计信息的搜集,可以获取更加全面的CBO信息。
为了充分利用CBO计算,需要搜集表、表列、表列索引的统计信息,保证CBO优化器模式下统计信息准确性,完整性。
下面简单介绍一下表、表列、表列索引统计信息关键点:
搜集表统计信息
- NUM_ROWS:表行数是CBO计算选择率基数的依据来源
- BLOCKS:表使用块数
- AVG_ROW_LEN:表记录平均长度,单位字节
- EMPTY_BLOCKS:高水位线下空块数量,CBO计算选择率依据之一
- CHAIN_CNT:行连接数量,表明表数据块物理分布情况
- SAMPLE SIZE:搜集统计信息的采样比例,体现采样统计信息的精准度
- LAST ANALYZED:记录上一次 ANALYZE搜集时间
搜集表列统计信息
- NUM_DISTINCT:表列去重值数量(NDV),用于计算选择率
- NUM_NULLS:表列空值,也用于计算选择率
- LOW_VALUE/HIGH_VALUE:用于计算多谓词选择率与基数
- DENSITY:表列数据分布密度,用于计算选择率
- NUM_BUCKETS:直方图列中Buckets数量,用于CBO绑定变量窥视
搜集表列索引统计信息
- 索引叶节点块数:统计索引块数量,用于计算索引成本
- 索引二元高度Levels:索引树的高度,用于计算遍历索引的成本
- 索引集簇因子(CF:Clustering Factor):判断是否选择使用索引的依据依据之一
- 去重键数量(Distinct Keys),用于计算索引成本