Oracle数据库分区表原理学习

当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。
Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。
Oracle的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查询时直接指定分区的方法来进行查询。
分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。

什么时候应该进行表分区:
1.表的大小超过2GB。
2.表中包含历史数据,新的数据被增加都新的分区中。

分区表的优点:
1.改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。
2.增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;
3.维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;
4.均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。

Oracle 10g提供了以下几种类型:
1.范围分区(range);
2.哈希分区(hash);
3.列表分区(list);
4.范围-哈希复合分区(range-hash);
5.范围-列表复合分区(range-list)。

当使用范围分区时,请考虑以下几个规则:
1.每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
2.所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。
3.在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。

Range分区:
Range分区是应用范围比较广泛的表分区方式,它是以列的值的范围来做为分区的划分条件,将记录存放到列值所在的range分区中。如按照时间划分,2013年1月的数据放到ask1分区,2月的数据放到ask2分区,大于2月的数据放在ask3分区。在创建的时候,需要指定基于的列,以及分区的范围值。在按时间分区时,如果某些记录暂无法预测范围,可以创建maxvalue分区,所有不在指定范围内的记录都会被存储到maxvalue所在分区中。
实例如下:
1.首先创建测试表空间create table askoracle
(
userid number,
time date
)
partition by range (time)
(
partition part_1 values less than (to_date('2013-01-01','yyyy-mm-dd')) tablespace ask1,
partition part_2 values less than (to_date('2013-02-01','yyyy-mm-dd')) tablespace ask2,
partition part_3 values less than (maxvalue) tablespace ask3
);Hash分区:
对于那些无法有效划分范围的表,可以使用hash分区,这样对于提高性能还是会有一定的帮助。hash分区会将表中的数据平均分配到你指定的几个分区中,列所在分区是依据分区列的hash值自动分配,因此你并不能控制也不知道哪条记录会被放到哪个分区中,hash分区也可以支持多个依赖列。create table askoracle_hash
(
id number,
id1 number(8) not null
)
partition by hash(id)
(
partition part_1 tablespace ask1,
partition part_2 tablespace ask2,
partition part_3 tablespace ask3
);Hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。

List分区:
List分区也需要指定列的值,其分区值必须明确指定,该分区列只能有一个,不能像range或者hash分区那样同时指定多个列做为分区依赖列,但它的单个分区对应值可以是多个。 在分区时必须确定分区列可能存在的值,一旦插入的列值不在分区范围内,则插入/更新就会失败,因此通常建议使用list分区时,要创建一个default分区存储那些不在指定范围内的记录,类似range分区中的maxvalue分区。
实例如下:城市代码分区时,可以指定default,把非分区规则的数据,全部放到这个default分区create table askoracle_list
(
id varchar2(15) not null,
areacode varchar2(4)
)
partition by list (areacode)
(
partition p_list025 values ('025') tablespace ask1,  
partition p_list372 values ('372') tablespace ask2,
partition p_other values (default) tablespace ask3
)如果某表按照某列分区之后,仍然较大,或者是一些其它的需求,还可以通过分区内再建子分区的方式将分区再分区,即组合分区的方式。 组合分区呢在10g中有两种:range-hash,range-list。注意顺序,根分区只能是range分区,子分区可以是hash分区或list分区。

Range-hash分区:
这种分区是基于Range和Hash分区,表首先按某列进行Range分区,然后再按某列进行Hash分区。实例如下:create table askoracle_range_hash
(
id number,
time date
)
partition by range(time) subpartition by hash(id)
subpartitions 3 store in (ask1,ask2,ask3)
(
partition part_1 values less than(to_date('2013-01-01','yyyy-mm-dd')),
partition part_2 values less than(to_date('2014-01-01','yyyy-mm-dd')),
partition part_3 values less than(maxvalue)
);create table askoracle_range_hash1 (deptno number, empname varchar(32), grade number)   
partition by range(deptno) subpartition by hash(empname)
subpartition template
(
subpartition linux tablespace ask1,
subpartition askoracle tablespace ask2,
subpartition downzz tablespace ask3
)
(
partition part_1 values less than (1000),
partition part_2 values less than (2000),
partition part_3 values less than (maxvalue)
);Range-list分区:
这种分区是基于range分区和list分区,表首先按某列进行range分区,然后再按某列进行list分区,分区之中的分区被称为子分区。create table askoracle_range_list
(
id number(10),
time date,
status varchar2(20)
) tablespace askoracle
partition by range(time) subpartition by list(status)
(
partition part_1 values less than(to_date('2013-01-01','yyyy-mm-dd'))
(
subpartition part_1_1 values ('active'),
subpartition part_1_2 values ('inactive')
),
partition part_2 values less than(to_date('2013-02-01','yyyy-mm-dd'))
(
subpartition part_2_1 values ('active'),
subpartition part_2_2 values ('inactive')
)
)常用视图:
1.查询当前用户下有哪些是分区表:
SELECT * FROM USER_PART_TABLES;

2.查询当前用户下有哪些分区索引:
SELECT * FROM USER_PART_INDEXES;

3.查询当前用户下分区索引的分区信息:
SELECT * FROM USER_IND_PARTITIONS T
WHERE T.INDEX_NAME=?

4.查询当前用户下分区表的分区信息:
SELECT * FROM USER_TAB_PARTITIONS T
WHERE T.TABLE_NAME=?;

5.查询某分区下的数据量:
SELECT COUNT(*) FROM TABLE_PARTITION PARTITION(TAB_PARTOTION_01);

6.查询索引、表上在那些列上创建了分区:
SELECT * FROM USER_PART_KEY_COLUMNS;

7.查询某用户下二级分区的信息(只有创建了二级分区才有数据):
SELECT * FROM USER_TAB_SUBPARTITIONS;

Admin 发表于 2013-3-30 16:29:40

将现有的普通表转换为分区表有以下四种方法:
1. Export/import method
2. Insert with a subquery method
3. Partition exchange method
4. DBMS_REDEFINITION
转换分区表更多详情参考地址!
  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值