分区表学习笔记(一)

Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。 

       Oracle 的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查询时直接指定分区的方法来进行查询。

--------------------------------------------------------------------------

公共准则:

1、如果选择的分区不能确保各分区内记录量的基本平均,则这种分区方式有可能是不恰当的。比如对于range分区,假设分了10个分区,而其中一个分区中的记录数占总记录数的90%,其它9个分区只占总记录数的10%,则这个分区方式就起不到数据平衡的作用。当然,如果你的目的并不是为了平衡,只是为了区分数据,ok,对于这种情况,我想说的是,你务必要意识到存在这个问题。

2、对于分区的表或索引,其所涉及的所有分区,其块大小必须一致。最后,建议对于上面创建的表或建表脚本妥善保存并记忆,后面我们需要频繁用到,后续示例将均主要依赖前文中创建的表进行:)

-------------------------------------------------------------------------

1、什么时候需要分区表,官网的2个建议如下:When to Partition a Table

1Tables greater than 2GB should always be considered for partitioning.

2Tables  containing  historical  data,  in  which  new  data  is  added  into  the  newest partition. A typical example is a historical table where only the current month's data is updatable and the other 11 months are read only.

oracle 10g中最多支持1024k-1个分区

  Tables can be partitioned into up to 1024K-1 separate partitions

联机文档上有关分区表和索引的说明:

  Partitioned Tables and Indexes

  http://download.oracle.com/docs/cd/B19306_01/server.102/b14220/partconc.htm#sthref2604

 

2、分区提供以下优点:  

  1)由于将数据分散到各个分区中,减少了数据损坏的可能性; 

  2)可以对单独的分区进行备份和恢复; 

  3)可以将分区映射到不同的物理磁盘上,来分散IO  

  4)提高可管理性、可用性和性能。 

 

3、分区表提供的视图

   1user_tab_partitions /dba_tab_partitions视图记录表的分区的信息

例子

create table pdba (id,time) partition by range(time)

(partition p1 values less than (to_date('2005-5-1','yyyy-mm-dd')),

partition p2 values less than (to_date('2005-7-1','yyyy-mm-dd')),

partition p3 values less than (to_date('2005-9-1','yyyy-mm-dd')),

partition p4 values less than (maxvalue)) as select rownum,created from dba_objects;

 

SQL> select  table_name,partition_name  from  user_tab_partitions  where table_name='PDBA';

TABLE_NAME                     PARTITION_NAME

------------------------------ ------------------------------

PDBA                           P1

PDBA                           P2

PDBA                           P3

PDBA                           P4

2 user_part_tables记录分区的表的信息;

SQL> select table_name,partitioning_type,PARTITION_COUNT,status from user_part_tables where table_name='PDBA';

TABLE_NAME                     PARTITION PARTITION_COUNT STATUS

------------------------------ --------- --------------- --------

PDBA                           RANGE                   5 VALID

4Oracle 10g提供了以下几种分区类型 

  1范围分区range); 

  2哈希分区hash); 

  3列表分区list); 

  4范围哈希复合分区range-hash);  

  5)范围-列表复合分区(range-list)。

1Range分区:  

       Range分区是应用范围比较广的表分区方式,它是以列的值的范围来做为分区的划分条件,将记录存放到列值所在的range分区中。如按照时间划分,20101月的数据放到a分区,2月的数据放到b分区,在创建的时候,需要指定基于的列,以及分区的范围值。在按时间分区时,如果某些记录暂无法预测范围,可以创建maxvalue分区,所有不在指定范围内的记录都会被存储到maxvalue所在分区中。

create table pdba (id number, time date) partition by range (time)

(

partition p1 values less than (to_date('2010-10-1', 'yyyy-mm-dd')),

partition p2 values less than (to_date('2010-11-1', 'yyyy-mm-dd')),

partition p3 values less than (to_date('2010-12-1', 'yyyy-mm-dd')),

partition p4 values less than (maxvalue)

)

2Hash分区:  

       对于那些无法有效划分范围的表,可以使用hash分区,这样对于提高性能还是会有一定的帮助。hash 分区会将表中的数据平均分配到你指定的几个分区中,列所在分区是依据分区列的hash值自动分配,因此你并不能控制也不知道哪条记录会被放到哪个分区中,hash分区也可以支持多个依赖列。 

create table test  

transaction_id number primary key,  

item_id number(8) not null

partition by hash(transaction_id) 

partition part_01 tablespace tablespace01, 

partition part_02 tablespace tablespace02, 

partition part_03 tablespace tablespace03 

);

在这里我们指定了每个分区的表空间。

 

3List分区  

       List分区也需要指定列的值,其分区值必须明确指定,该分区列只能有一个,不能像range或者hash分区那样同时指定多个列做为分区依赖列,但它的单个分区对应值可以是多个。 

       在分区时必须确定分区列可能存在的值,一旦插入的列值不在分区范围内,则插入/更新就会失败,因此通常建议使用list 分区时,要创建一个default分区存储那些不在指定范围内的记录,类似range分区中的maxvalue分区。  

       在根据某字段,如城市代码分区时,可以指定default,把非分区规则的数据,全部放到这个default分区。

 

create table custaddr

(

  id varchar2(15 byte) not null,

  areacode varchar2(4 byte)

 )

partition by list (areacode)

( partition t_list025 values ('025'),   

 partition t_list372 values ('372') , 

 partition t_list510 values ('510'), 

partition p_other values (default)

)

 

4)组合分区:  

       如果某表按照某列分区之后,仍然较大,或者是一些其它的需求,还可以通过分区内再建子分区的方式将分区再分区,即组合分区的方式。组合分区呢在10g中有两种:range-hashrange-list。注意顺序,根分区只能是range分区,子分区可以是hash分区或list 分区。 

create table test 

transaction_id number primary key,  

transaction_date date  

partition by range(transaction_date) subpartition by hash(transaction_id) 

subpartitions 3 store in (tablespace01,tablespace02,tablespace03) 

partition part_01 values less than(to_date(‘2009-01-01‘,‘yyyy-mm-dd‘)), 

partition part_02 values less than(to_date(‘2010-01-01‘,‘yyyy-mm-dd‘)), 

partition part_03 values less than(maxvalue) 

);

 

create  table  emp_sub_template  (deptno  number,  empname  varchar(32),  grade

number)     

     partition by range(deptno) subpartition by hash(empname)

     subpartition template

         (subpartition a tablespace ts1,

          subpartition b tablespace ts2,

          subpartition c tablespace ts3,

          subpartition d tablespace ts4

         )

    (partition p1 values less than (1000),

     partition p2 values less than (2000),

     partition p3 values less than (maxvalue)

    );

 

create table quarterly_regional_sales

      (deptno number, item_no varchar2(20),

       txn_date date, txn_amount number, state varchar2(2))

  tablespace ts4

  partition by range (txn_date)

    subpartition by list (state)

      (partition q1_1999 values less than (to_date('1-apr-1999','dd-mon-yyyy'))

         (subpartition q1_1999_northwest values ('or', 'wa'),

          subpartition q1_1999_southwest values ('az', 'ut', 'nm'),

          subpartition q1_1999_northeast values ('ny', 'vm', 'nj'),

          subpartition q1_1999_southeast values ('fl', 'ga'),

          subpartition q1_1999_northcentral values ('sd', 'wi'),

          subpartition q1_1999_southcentral values ('ok', 'tx')

         ),

       partition q2_1999 values less than ( to_date('1-jul-1999','dd-mon-yyyy'))

         (subpartition q2_1999_northwest values ('or', 'wa'),

          subpartition q2_1999_southwest values ('az', 'ut', 'nm'),

          subpartition q2_1999_northeast values ('ny', 'vm', 'nj'),

          subpartition q2_1999_southeast values ('fl', 'ga'),

          subpartition q2_1999_northcentral values ('sd', 'wi'),

          subpartition q2_1999_southcentral values ('ok', 'tx')

         ),

       partition q3_1999 values less than (to_date('1-oct-1999','dd-mon-yyyy'))

         (subpartition q3_1999_northwest values ('or', 'wa'),

          subpartition q3_1999_southwest values ('az', 'ut', 'nm'),

          subpartition q3_1999_northeast values ('ny', 'vm', 'nj'),

          subpartition q3_1999_southeast values ('fl', 'ga'),

          subpartition q3_1999_northcentral values ('sd', 'wi'),

          subpartition q3_1999_southcentral values ('ok', 'tx')

         ),

       partition q4_1999 values less than ( to_date('1-jan-2000','dd-mon-yyyy'))

         (subpartition q4_1999_northwest values ('or', 'wa'),

          subpartition q4_1999_southwest values ('az', 'ut', 'nm'),

          subpartition q4_1999_northeast values ('ny', 'vm', 'nj'),

          subpartition q4_1999_southeast values ('fl', 'ga'),

          subpartition q4_1999_northcentral values ('sd', 'wi'),

          subpartition q4_1999_southcentral values ('ok', 'tx')

         )

      );

       Oracle 11g组合分区功能这块有所增强又增加了range-range,list-range, list-list,list-hash并且 11g里面还支持Interval分区和虚拟列分区。

 

(本系列文章为个人的学习笔记,参考了许多前辈的文章,如DAVE等。如果侵权之嫌,请和我联系,尽快删除)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值