Oracle 10g中利用哈希函数提高查询速度

最新推荐文章于 2024-05-15 06:49:34 发布

jimmy1357

最新推荐文章于 2024-05-15 06:49:34 发布

阅读量1k

点赞数

分类专栏：数据库文章标签： oracle 查询速度大数据效率

数据库专栏收录该内容

1 篇文章 0 订阅

订阅专栏

原文地址：

当数据存储在一个普通表中的时候，这些记录将以插入到数据库时的顺序物理地保存到分配的块中。例如，如果有一个用于存储员工信息的表，那么员工姓名将会按照插入到表的顺序存储在表中。

如果员工记录非常多的话，那么数据表的响应速度就会逐渐变慢。你可以通过选择值相对等分布的一列（如员工的部门编号）并建立一个簇表来提高查询员工的速度。

在簇表中，如果员工属于同一个部门，那么它们的记录将物理地存储在同一系列的块中。这样就可以提高查找员工信息的速度，这是因为在检索某个特定部门的员工时，需要读取数据库块的数量减少了。而在非簇表中查找员工，就可能需要对每个数据库块进行访问。

当表中存在大量键值的时候，你就会开始发现由于存在许多簇块而导致的性能问题。避免这个问题的一个方法就是使用一个哈希函数来约束簇块的数量。哈希函数将会给定一个数值用来限定簇块数量的预计范围，但它得到的值是相对等分布的。例如你可以创建一个哈希函数，只比较部门编号的最后两位。

哈希函数中存在的一个问题就是函数值会打乱记录原本的顺序。你可以通过ORDER BY来解决这个问题；但是，在很多情况下，记录数量是非常庞大的。在Oracle 10g 中，你可以将一个数据定义为“natural order”，那么就可以不用经过排序而以你所希望的顺序来检索哈希簇的数据，从而解决了上面的提出问题。

例如，假设你有一个信用卡业务的数据库。你决定以信用卡号作为簇主键将有利于数据的存储分布。但是，由于存在大量的信用卡号，所以可以使用一个哈希函数来约束簇块的数量。而且你希望在你的大部分报表中数据是按照时间顺序排列的，那么在进行每个查询操作时使用排序哈希簇，而不要使用ORDER BY。下面给出了相关语句：

create cluster credit_cluster

(

card_no varchar2(16),

transdate date sort

)

hashkeys 10000 hash is ora_hash(card_no)

size 256;

create table credit_orders

(

card_no varchar2(16),

transdate date,

amount number

)

cluster credit_cluster(card_no,transdate);

alter session set nls_date_format ="YYYYMMDDHH24MISS";

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050131000123',57.99);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050130071216',16.59);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050131111111',39.00);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050130081001',25.16);

可以看到我在这里使用了一个新函数ORA_HASH 来为信用卡建立一个哈希数值。现在，你可以非常简单地对某个信用卡数据进行查询，并返回自动排序后的结果。

当数据存储在一个普通表中的时候，这些记录将以插入到数据库时的顺序物理地保存到分配的块中。例如，如果有一个用于存储员工信息的表，那么员工姓名将会按照插入到表的顺序存储在表中。

如果员工记录非常多的话，那么数据表的响应速度就会逐渐变慢。你可以通过选择值相对等分布的一列（如员工的部门编号）并建立一个簇表来提高查询员工的速度。

在簇表中，如果员工属于同一个部门，那么它们的记录将物理地存储在同一系列的块中。这样就可以提高查找员工信息的速度，这是因为在检索某个特定部门的员工时，需要读取数据库块的数量减少了。而在非簇表中查找员工，就可能需要对每个数据库块进行访问。

当表中存在大量键值的时候，你就会开始发现由于存在许多簇块而导致的性能问题。避免这个问题的一个方法就是使用一个哈希函数来约束簇块的数量。哈希函数将会给定一个数值用来限定簇块数量的预计范围，但它得到的值是相对等分布的。例如你可以创建一个哈希函数，只比较部门编号的最后两位。

哈希函数中存在的一个问题就是函数值会打乱记录原本的顺序。你可以通过ORDER BY来解决这个问题；但是，在很多情况下，记录数量是非常庞大的。在Oracle 10g 中，你可以将一个数据定义为“natural order”，那么就可以不用经过排序而以你所希望的顺序来检索哈希簇的数据，从而解决了上面的提出问题。

例如，假设你有一个信用卡业务的数据库。你决定以信用卡号作为簇主键将有利于数据的存储分布。但是，由于存在大量的信用卡号，所以可以使用一个哈希函数来约束簇块的数量。而且你希望在你的大部分报表中数据是按照时间顺序排列的，那么在进行每个查询操作时使用排序哈希簇，而不要使用ORDER BY。下面给出了相关语句：

create cluster credit_cluster

(

card_no varchar2(16),

transdate date sort

)

hashkeys 10000 hash is ora_hash(card_no)

size 256;

create table credit_orders

(

card_no varchar2(16),

transdate date,

amount number

)

cluster credit_cluster(card_no,transdate);

alter session set nls_date_format ="YYYYMMDDHH24MISS";

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050131000123',57.99);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050130071216',16.59);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050131111111',39.00);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050130081001',25.16);

可以看到我在这里使用了一个新函数ORA_HASH 来为信用卡建立一个哈希数值。现在，你可以非常简单地对某个信用卡数据进行查询，并返回自动排序后的结果。

当数据存储在一个普通表中的时候，这些记录将以插入到数据库时的顺序物理地保存到分配的块中。例如，如果有一个用于存储员工信息的表，那么员工姓名将会按照插入到表的顺序存储在表中。

如果员工记录非常多的话，那么数据表的响应速度就会逐渐变慢。你可以通过选择值相对等分布的一列（如员工的部门编号）并建立一个簇表来提高查询员工的速度。

在簇表中，如果员工属于同一个部门，那么它们的记录将物理地存储在同一系列的块中。这样就可以提高查找员工信息的速度，这是因为在检索某个特定部门的员工时，需要读取数据库块的数量减少了。而在非簇表中查找员工，就可能需要对每个数据库块进行访问。

当表中存在大量键值的时候，你就会开始发现由于存在许多簇块而导致的性能问题。避免这个问题的一个方法就是使用一个哈希函数来约束簇块的数量。哈希函数将会给定一个数值用来限定簇块数量的预计范围，但它得到的值是相对等分布的。例如你可以创建一个哈希函数，只比较部门编号的最后两位。

哈希函数中存在的一个问题就是函数值会打乱记录原本的顺序。你可以通过ORDER BY来解决这个问题；但是，在很多情况下，记录数量是非常庞大的。在Oracle 10g 中，你可以将一个数据定义为“natural order”，那么就可以不用经过排序而以你所希望的顺序来检索哈希簇的数据，从而解决了上面的提出问题。

例如，假设你有一个信用卡业务的数据库。你决定以信用卡号作为簇主键将有利于数据的存储分布。但是，由于存在大量的信用卡号，所以可以使用一个哈希函数来约束簇块的数量。而且你希望在你的大部分报表中数据是按照时间顺序排列的，那么在进行每个查询操作时使用排序哈希簇，而不要使用ORDER BY。下面给出了相关语句：

create cluster credit_cluster

(

card_no varchar2(16),

transdate date sort

)

hashkeys 10000 hash is ora_hash(card_no)

size 256;

create table credit_orders

(

card_no varchar2(16),

transdate date,

amount number

)

cluster credit_cluster(card_no,transdate);

alter session set nls_date_format ="YYYYMMDDHH24MISS";

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050131000123',57.99);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050130071216',16.59);

insert into credit_orders(card_no,transdate,amount)

values ('4111111111111111','20050131111111',39.00);

insert into credit_orders(card_no,transdate,amount)

values('4111111111111111','20050130081001',25.16);

可以看到我在这里使用了一个新函数ORA_HASH 来为信用卡建立一个哈希数值。现在，你可以非常简单地对某个信用卡数据进行查询，并返回自动排序后的结果。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Oracle 10g中利用哈希函数提高查询速度

当数据存储在一个普通表中的时候，这些记录将以插入到数据库时的顺序物理地保存到分配的块中。例如，如果有一个用于存储员工信息的表，那么员工姓名将会按照插入到表的顺序存储在表中。如果员工记录非常多的话，那么数据表的响应速度就会逐渐变慢。你可以通过选择值相对等分布的一列（如员工的部门编号）并建立一个簇表来提高查询员工的速度。在簇表中，如果员工属于同一个部门，那么它们的记录将物理地存储在同一
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。