ROWID基础概念
在Oracle内部,每个数据表都有一个伪列ROWID,用于存放被称为ROWID的二进制值。每个ROWID代表了一行数据的存储地址。物理ROWID能够标识普通数据表中的一行信息。其中ROWID类型只能存储物理内容,而UROWID(universal rowid)类型可以存储物理,逻辑或外来(non-oracle)ROWID。
物理ROWID(PhysicalRowid)可以让我们快速的访问某些特定的行。只要行存在,它的物理ROWID就不会改变。高效稳定的物理ROWID在查询行集合、操作整个集合和更新子集是很有用的。例如,我们可以在UPDATE或DELETE语句的WHERE子句中比较UROWID变量和ROWID伪列来找出最近一次从游标中取出的行数据。
ROWID分类
- ROWID
- 物理ROWID(普通堆表中的ROWID)
- 扩展ROWID(extended rowid)
- 限制ROWID(restricted rowid),Oracle7以前的格式,现已不在使用。
- 逻辑ROWID(索引组织表(IOT)的ROWID)
- 物理ROWID(普通堆表中的ROWID)
ROWID格式 [18位,4部分]
OOOOOOFFFBBBBBBRRR主要由四部分组成:
“OOOOOO”代表数据对象号(Data Object Number),如上例中的”AAAUpY”,能够辨识数据库段。同一段中的模式对象,都有着相同的数据对象号。
“FFF”代表文件号(File Number),如上例中的”AAE”,能辨识出包含行的数据文件。在数据库中,文件号是唯一的。
“BBBBBB”代表块号(Block Number),如上例中的”AAAAlc”,能辨识出包含行的数据块。块号是与它们所在的数据文件相关,而不是表空间。所以,两个在同一表空间的行数据,如果它们处于不同的数据文件中,也可能有着相同的块号。
“RRR”代表了行号(Row Number),如上例中的”AAA”-“AAJ”,可以辨识块中的行数据。
ROWID相关函数
-- Oracle提供了dbms_rowid来进行rowid的一些转换计算。
-- 根据rowid抽取块对象编号
SELECT dbms_rowid.rowid_object(ROWID) FROM SAMPLE WHERE ROWNUM <=1;
-- 根据rowid抽取表空间相对文件号
SELECT dbms_rowid.rowid_relative_fno(ROWID) FROM SAMPLE WHERE ROWNUM <=1;
-- 根据rowid抽取块号
SELECT dbms_rowid.rowid_block_number(ROWID) FROM SAMPLE WHERE ROWNUM <=1;
-- 根据rowid抽取行号
SELECT dbms_rowid.rowid_row_number(ROWID) FROM SAMPLE WHERE ROWNUM <=1;
ROWID的实际运用场景 -> 快速删除重复的记录
ROWID是数据的详细地址,通过ROWID,Oracle可以快速的定位某行具体的数据的位置。当表中有大量重复数据时,可以使用ROWID快速删除重复的记录。
实例:
--建表tbl
SQL> create table stu(no number,name varchar2(10),sex char(2));
--添加测试记录
SQL> insert into stu values(1, 'ab',’男’);
SQL> insert into stu values(1, 'bb',’女’);
SQL> insert into stu values(1, 'ab',’男’);
SQL> insert into stu values(1, 'ab',’男’);
SQL> commit;
删除重复记录方法很多,列出两种常见方法。
(1) 通过创建临时表
可以把数据先导入到一个临时表中,然后删除原表的数据,再把数据导回原表,SQL语句如下:
SQL>create table stu_tmp as select distinct* from stu;
SQL>truncate table sut; //清空表记录
SQL>insert into stu select * from stu_tmp; //将临时表中的数据添加回原表
这种方法可以实现需求,但是很明显,对于一个千万级记录的表,这种方法很慢,在生产系统中,这会给系统带来很大的开销,不可行。
(2) 利用rowid结合max或min函数
使用rowid快速唯一确定重复行结合max或min函数来实现删除重复行。
SQL>delete from stu a where rowid not in (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex); //这里max使用min也可以
或者用下面的语句
SQL>delete from stu a where rowid < (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex); //这里如果把max换成min的话,前面的where子句中需要把"<"改为">"
跟上面的方法思路基本是一样的,不过使用了group by,减少了显性的比较条件,提高效率。
SQL>delete from stu where rowid not in (select max(rowid) from stu t group by t.no, t.name, t.sex );
思考:若在stu表中唯一确定任意一行数据(1, 'ab',’男’),把sex字段更新为”女”,怎么做?
SQL>update stu set sex=’女’ where rowid=(select min(rowid) from stu where no=1 and name=’ab’ and sex=’男’);