Oracle单表去重复(二)

Oracle单表去重

去重有两层含义,一:是记录完全一样。二:是符合一定条件的认为是重复。
根据表的数量,去重可划分为:单表去重和多表关联去重。
 
对于去重,一般最容易想到的是用distinct,而distinct只能对记录 完全重复的记录保留一条。
distinct使用的是二重循环的方式来去重的,如果数据量非常大的时候,会导致性能急剧下降。
我们前一篇文章已经给出了详解,你可以去查看  Oracle单表去重复(一)  
 
下面是一个单表去重的测试,认为name字段相同的即为重复记录,要查询出一个结果,过滤掉重复,distinct显然不能满足要求。
 
表SQL:
create  table A_TEST    
(    
        id                 number,    
         name         varchar2(20),    
        remark varchar2(20)    
);    

insert  into A_TEST (ID,  NAME, REMARK)    
values (1,  'a''ss');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (2,  'b''xxx');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (3,  'b''x');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (4,  'b''asd');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (5,  'c''axxx');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (6,  'c''asdf');    
 
 
去重方式一(低效):
select a.*    
         from A_TEST a, ( select  min(id)  as id  from A_TEST t  group  by  name) b    
where a.id = b.id;
 
去重方式一(高效):
select *    
         from ( select a.*, rownum row_num  from A_TEST a) x    
where x.row_num  in ( select  min(rownum)  from A_TEST t  group  by  name)
 
可见,使用rownum的效率比使用id的效率要高,当表数据量很大的时候,差距会很明显。

出处:http://lavasoft.blog.51cto.com/62575/368087

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值