Oracle分区表
什么是分区
在Oracle数据库中,为了提升对大表/大索引的可管理性、可维护性以及性能,Oracle引入了分区表机制,可以将大表/大索引分解为多个小的、可管理的分区。多个分区相对独立,有独立的存储结构,共同构成了整个完整的表/索引。分区对用户操作可以是透明,即对访问数据库的应用而言,逻辑上讲只有一个表或一个索引(相当于应用看到的仍然只是一个表或索引),但在物理上这个表或索引可能由数个物理分区组成。
什么时候需要分区
Oracle官网的建议以下情形采用分区表:
-
表数据量大于2GB时应该考虑使用分区;
-
新数据加入至最新分区中的用于存储历史数据的表。
分表和分区表的区别
为了分散存储大表/索引的数据,另外一种途径是分表,分表是将一个大表按照一定的规则分解成多张具有独立存储空间的实体表,例如可以将客户表customer拆分成两个表,一个用于存储个人客户 customer_person,另一个存储对公客户 customer_company。分表完全独立,在逻辑上是多张不同的表,而分区表在物理上是一张表。分区表对应用透明易于管理维护,分表不易于管理维护。
分区表的类型
- 范围分区(Range Partitioning)
- 列表分区(List Partitioning)
- 哈希分区(Hash Partitioning)
- 组合分区(Composite Partitioning)
基本分区是指仅仅使用了一层分区(范围分区、列表分区、哈希分区)的分区表。
如果对分区表进行多层级的分区,则称为组合分区。
范围分区表
1- 分区键
分区是将非常大的表或者索引分解成多个小的、可管理的部分。分区表是通过分区键来分解分区的。分区键决定了分区表中的每一行数据流向哪个分区。分区表中的每一行数据根据分区键,隐式地被分配到一个分区中。
2- 范围分区
范围分区按照分区键,根据数据行落在分区键中不同的范围值来划分分区。
案例1:(时间范围分区)
-- 建立分区表
CREATE TABLE time_range_tab
( t_id NUMBER(6),
t_name VARCHAR2(20),
dob DATE
)
PARTITION BY RANGE (dob)
(PARTITION p_2020 VALUES LESS THAN (TO_DATE('2021-1-1','YYYY-MM-DD')),
PARTITION p_2021 VALUES LESS THAN (TO_DATE('2022-1-1','YYYY-MM-DD')),
PARTITION p_2022 VALUES LESS THAN (TO_DATE('2023-1-1','YYYY-MM-DD')),
PARTITION p_2023 VALUES LESS THAN (MAXVALUE)
);
-- 插入数据
insert into time_range_tab values(1, 'a', to_date('2019-2-5', 'yyyy-mm-dd'));
insert into time_range_tab values(2, 'b', to_date('2020-2-5', 'yyyy-mm-dd'));
insert into time_range_tab values(3, 'c', to_date('2021-2-5', 'yyyy-mm-dd'));
insert into time_range_tab values(4, 'd', to_date('2022-2-5'