本篇主要介绍Oracle 11g中推出的“延迟段创建”(Deferred Segment Creation)特性,以及当我们使用这种特性时,需要注意的问题。
1)Deferred Segment Creation
在Oracle中,“表空间(Tablespace)、段(Segment)、分区(Extent)和块(Block)”是逻辑存储结构的四个层次。对数据表而言,通常是由一个或者多个段对象(分区表)Segment组成。也就是说,在数据表创建的时刻,Oracle会创建一个数据段Segment对象与之对应。
当Segment创建之后,Oracle空间管理机制会根据需要分配至少一个extent作为初始化。每个extent的大小需要根据不同tablespace进行配置。但是在11g之前,数据表的创建同时,就发生了空间Segment分配的过程。但是在Oracle 11g中,引入了Deferred Segment Creation特性。
首先我们创建一个数据表justForTest,来观察数据库是否为此表分配segment。
SQL> create table justForTest(test1 varchar2(2));
Table created
但是,对应的段segment对象,却没有创建出来,如下:
select segment_name, BYTES, BLOCKS, EXTENTS from user_segments where segment_name='JUSTFORTEST';
SEGMENT_NAME BYTES BLOCKS EXTENTS------------ ---------- ---------- ----------
这就是在Oracle 11g中引入的延迟段生成。一个数据表,如果刚刚创建出来的时候没有数据加入。Oracle是不会为这个对象创建相应的段结构,也就不会分配对应的空间。
使用dbms_metadata抽取出数据表的DDL语句,可以发现端倪,如下:
CREATE TABLE "test"."JUSTFORTEST"
( "TEST1" VARCHAR2(2)
) SEGMENT CREATION DEFERRED
PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 NOCOMPRESS LOGGING
TABLESPACE "testNS";
使用DDL语句可以获取到创建数据表的所有语句参数,包括默认参数。其中,我们发现了一个在过去版本中没有参数“SEGMENT CREATION DEFERRED”,该参数就表示在数据表创建中使用延迟段生成。
2)Segment Creation
那么,在什么时点上Oracle才会创建对象呢?只要插入一条数据到数据表中,无论是否commit,都会伴随着Oracle对数据表段的创建操作。
SQL> insert into justForTest values('1');
1 row inserted
SQL> select segment_name, BYTES, BLOCKS, EXTENTS from user_segments where segment_name='JUSTFORTEST';
SEGMENT_NAME BYTES BLOCKS EXTENTS------------ ---------- ---------- ----------
JUSTFORTEST 65536 8 1
Oracle推出Deferred Segment Creation的出发点很单纯,就是出于对象空间节省的目的。如果一个空表从来就没有使用过,创建segment对象,分配空间是“不合算”的,所以提出推迟段创建的时间点。
该功能的启用在Oracle中是存在控制参数的。
SQL> show parameter deferred_segment_creation;
NAME TYPE VALUE-----
deferred_segment_creation boolean TRUE
当然,我们可以将deferred_segment_creation参数调为false,这样调整后建的表都会立即分配空间,但是调整前的表都不会改变,调整方法如下:
alter system set deferred_segment_creation=false;
如果deferred_segment_creation为true,那么数据库中空表就不会立即分配extent,即不占数据空间,当我们使用exp导出数据库的时候,这些空表也会无法导出。如果想把空表也一起导出,我们可以参考Oracle 11g导出空表、少表的解决办法这篇文章。
创建数据表create table是我们对数据库进行的常见操作。我们一般使用create table之后,指定了数据列信息和主键等约束信息,其他就交给Oracle使用默认值了。今天我们一起来看看这些默认值。说明:本片只关注一般数据表,临时表、聚簇、IOT等特殊类型暂时不考虑。
提取完整的DDL
首先我们需要提取出创建数据表的完整DDL语句,才能将Oracle提供的默认值们正确抽取出来。此处我们使用dbms_metadata.get_ddl方法。
//源数据抽取脚本
set serveroutput on size 10000;
set timing on;
declare
c_ddl clob;
begin
c_ddl := dbms_metadata.get_ddl('TABLE','DEPT','SCOTT');
dbms_output.put_line(c_ddl);
end;
/
//输出结果
CREATE TABLE "SCOTT"."DEPT"
( "DEPTNO" NUMBER(2,0),
"DNAME" VARCHAR2(14),
"LOC" VARCHAR2(13),
CONSTRAINT "PK_DEPT" PRIMARY KEY ("DEPTNO")
USING INDEX PCTFREE 10 INITRANS 2 MAXTRANS 255 COMPUTE STATISTICS
STORAGE(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645
PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)
TABLESPACE "USERS" ENABLE
)
PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 NOCOMPRESS LOGGING
STORAGE
(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645
PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)
TABLESPACE "USERS"
上面是使用Oracle自带的源数据导出工具,对Scott用户下的数据表EMP进行提取的DDL语句。
注意:其上有两个片段(标注红色)是相似。这个要说明一下,我们建立一个数据表,在Oracle中要建立数据段data segment对象。同时,如果我们指定了主键,Oracle会自动为这个主键建立索引,索引是一种索引段index segment对象。所以,如果在建立数据表的时候,也指定了主键primary key,那么一共会生成两个段segment对象。
下面,我们对相似的代码参数片段进行分析。
1、PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 NOCOMPRESS LOGGING
2、STORAGE
(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645
PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)
3、TABLESPACE "USERS"
代码段可以分为三个部分,下面分别进行介绍。
Part1、数据块Data Block与表属性部分
标注1部分表示是数据块结构和使用参数,以及我们的数据表在使用中的一些参数。在Oracle中,数据库逻辑结构被划分为“表空间Tablespace、段对象Segment、分区extent和块block”。其中,block是最小的结构对象。
PCTFREE:为数据更新准备的“留白”
数据终究是要写入到数据块里面的。对数据表中的块block来说,都会依次填满行数据。而Oracle写数据表的顺序是首先找到一个空闲块,之后向空闲块中写入数据。
那么Oracle如何判断这个数据块是否非空闲呢?就是使用PCTFREE参数了,该参数是一个百分比值,默认为10%。如果一个数据块空闲的空间低于PCTFREE设定值,就认为这个数据块已经写满。会将这个块从空闲块的列表(FREELIST)上取下来。
那么,为什么要有这个参数?为什么要保留这10%呢?答案就是为了进行update使用。数据保存在数据行里,随着不断的更新,每行所占有的空间是一个不定的范围。在数据插入之后,如果发生存储空间增加(比如:varchar2类型字符长度变化),余下的10%就留作数据行空间延展使用。
那么,如果超过这个10%,还是不能装下数据怎么办?Oracle定位数据使用的物理rowid机制,实际上就是定位特定的数据行在某个数据块的第几个slot(槽)上。如果一个数据块再也装不下一些数据行,那么这些数据行就需要另找一个新的数据块进行保存。也就意味着这些行有一个新的new-rowid位置。但是,Oracle还会按照原来的old-rowid定位数据行。原来的数据块上,记录着该数据行的新位置new-rowid,再次找到新的数据行位置。这个技术过程就称为行迁移(row migrate)。
注意:我们要读一个数据行的内容。理论上希望访问的数据块越少越好,最好只有一个块。但是,如果发生行迁移,我们就不得不访问多个数据块才能得到数据。所以,行迁移是我们通常不希望看到的。解决的方法,就是保留一个适当的PCTFREE值。
选择合适的PCTFREE的值要根据系统的性质而定。如果是一个典型的OLTP系统,数据更新操作多,变化大。这时候就需要设置一个略大些的PCTFREE。相反,如果更新很少,大部分都是读操作,PCTFREE略小些也无碍。
PCTFREE意味着一种空间的闲置。如果需要进行某种数据表压缩,设置PCTFREE为0也是一种思路。
PCTUSED:数据块的判定容量底线
刚才我们谈论PCTFREE的时候,介绍了Oracle在写入数据的时候,是将新数据写入到数据块中,直到认为已经满了后,再寻找新块写入。这个过程相反的是,如果一个过去写满的数据块,经过若干次删除后,会逐渐变空,那么什么时间点才能认为这个块是一个空闲块,能接受新的数据插入呢?
这就是PCTUSED参数的用途。如果一个数据块的使用容量低于PCTUSED设置的限制,那么就认为这个数据块已经空闲,可以放置回FREELIST列表中,作为空闲数据块接受新数据行的插入。
一般是不需要调节这个参数的,笔者认为,频繁的数据块空闲或者写满切换,是有损于数据库性能的。所以,设置默认的40%一般是可以接受的。对一些数据变化巨大,删除频繁的系统,这个参数可以配合PCTFREE统一筹划。
INITRANS和MAXTRANS
初始事务INITRANS和最大事务MAXTRANS是在数据块级别的参数。Oracle行级锁是Oracle最大的特点之一。数据库事务的本质还是对数据块的修改,而事务的信息是记录在数据块头。
参数INITRANS的作用就是表示数据块上可以标记的初始事务数目。如果同时进行的事务数据量超过这个数量,事务数目可以增加,直到达到MAXTRANS的限制
从性能角度看,我们不希望一个数据块同时进行过多的事务。因为这样起码意味着数据块过热。所以,建议设置一个合理的INITRANS。