Oracle收集直方图信息

原创 2013年12月05日 22:14:33

          直方图在列数据分布不均匀时非常有用,查询优化器需要直方图信息才能做出正确的估算。有频度直方图与等高直方图两种。本篇依然使用上一篇的测试表,文章链接Oracle中收集表与列统计信息

一、频度直方图

          频度直方图使用的不是频度,而是使用累积频度。下面的endpoint_number是取值的累计次数。

SELECT ENDPOINT_VALUE,
       ENDPOINT_NUMBER,
       ENDPOINT_NUMBER - LAG(ENDPOINT_NUMBER, 1, 0) OVER(ORDER BY ENDPOINT_NUMBER) AS FREQUENCY
  FROM USER_TAB_HISTOGRAMS
 WHERE TABLE_NAME = 'T'
   AND COLUMN_NAME = 'VAL2'
 ORDER BY ENDPOINT_NUMBER;


ENDPOINT_VALUE ENDPOINT_NUMBER  FREQUENCY
-------------- --------------- ----------
           101               8          8
           102              33         25
           103             101         68
           104             286        185
           105             788        502
           106            1000        212

          频度直方图的本质特征有:

①桶数(分类数)等于唯一值总数。

②列endpoint_value提供该本身。

③列endpoint_number是取值的累计出现次数。只有当前endpoint_number减去上一endpoint_number才是当前值的出现次数。

         下面演示查询优化器怎样使用频度直方图精确地估算出基于列val2过滤后查询返回的基数(cardinality)。

EXPLAIN PLAN SET STATEMENT_ID '101' FOR SELECT * FROM t WHERE val2=101;
EXPLAIN PLAN SET STATEMENT_ID '102' FOR SELECT * FROM t WHERE val2=102;
EXPLAIN PLAN SET STATEMENT_ID '103' FOR SELECT * FROM t WHERE val2=103;
EXPLAIN PLAN SET STATEMENT_ID '104' FOR SELECT * FROM t WHERE val2=104;
EXPLAIN PLAN SET STATEMENT_ID '105' FOR SELECT * FROM t WHERE val2=105;
EXPLAIN PLAN SET STATEMENT_ID '106' FOR SELECT * FROM t WHERE val2=106;

SELECT STATEMENT_ID,CARDINALITY FROM plan_table WHERE ID=0;

STATEMENT_ID

CARDINALITY

101

8

102

25

103

68

104

185

105

502

106

212

          当列的唯一值的个数大于桶允许的最大数量(254)时,就不能使用频度直方图了,此时应该使用等高直方图。

一、等高直方图

          下面演示如何在val2列产生等高直方图。

SELECT COUNT(*), MAX(VAL2) AS ENDPOINT_NUMBER
  FROM (SELECT VAL2, NTILE(5) OVER(ORDER BY VAL2) AS ENDPOINT_NUMBER FROM T)
 GROUP BY ENDPOINT_NUMBER
 ORDER BY ENDPOINT_NUMBER;


  COUNT(*) ENDPOINT_NUMBER
---------- ---------------
       200             104
       200             105
       200             105
       200             106
       200             106

         这表示最小值到104之间有200个数,104到105有200个数,105到105有200个数,依此类推。也就是说每个桶上放的数是均匀的。上面的查询分配了5个桶,共装1000个数,平均一个桶装200个数。

         然而在数据字典中存储等高直方图信息时,端点相同并且紧邻的桶是没有的,它存储的是一个压缩值。在直方图中多次出现的值被称为频繁值。

         等高直方图的特征:

①  桶数少于唯一值总数。

②  端点值就是列的数值。这里要注意一点,非数字类型必须进行转换,此值仅取前六个字节。

③  endpoint_number列给出了桶号。

④  等高直方图不存储一个取值的频度。



ORACLE的直方图的

一.何谓直方图: 直方图是一种统计学上的工具,并非管理对象的某个方面的质量情况进行管理,通常情况下它会表现为一种几何图形表,这个图形表是根据从实际环境中所收集来的被管理对象某个方面的质量分布情况的数...
  • tchic
  • tchic
  • 2016年09月04日 18:56
  • 984

如何看懂oracle 直方图

转自:http://czmmiao.iteye.com/blog/1484298 直方图概述: 在Oracle中直方图是一种对数据分布质量情况进行描述的工具。它会按照某一列不同值出现数量多少,...

oracle直方图

直方图 当某列数据分布不均衡,为了让CBO能生成最佳的执行计划,我们可能需要对表收集直方图,直方图最大的桶数(Bucket)是254。 收集直方图是一个很耗时的过程,如无必要,千万别去收集直方图。 ...

网络电话是如何实现打到普通话机上的?

原文地址:http://blog.sina.com.cn/s/blog_4a0823ca010004ye.html 在基于TCP/IP的网络里,我们的信息,包括邮件,IM,WEB等所有的PC--...

Oracle 10g 与 11g 绑定变量(Bind Variable) 区别 说明

一. Oracle 11gR2官网的说明http://download.oracle.com/docs/cd/E11882_01/server.112/e16638/optimops.htm 1.1 ...

Oracle11g 多列收集统计信息--直方图

最近发现有一条SQL要执行几百秒,是执行计划走错了,为什么走错呢?来看一下: SELECT *   FROM (SELECT *           FROM (SELECT INNER_TABLE....

值分布不均衡的列建索引不收集直方图信息的结果

在一个值分布不均衡的列上建索引,但是收集统计信息的时候没有收集直方图信息的情况下会走索引吗? SQL> create table t as select * from dba_objects; ...

Oracle 直方图计算

  • 2014年12月03日 13:30
  • 10KB
  • 下载

手工设置列的直方图信息

从dba_source中摘取的相关内容信息:-- types for minimum/maximum values and histogram endpoints type numarray is ...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Oracle收集直方图信息
举报原因:
原因补充:

(最多只允许输入30个字)