删除重复记录的多种方法

在Oracle中,可以通过唯一rowid实现删除重复记录;还可以建临时表来实现...这个只提到其中的几种简单实用的方法,希望可以和大家分享(以表employee为例)。

  SQL> desc employee

  Name Null? Type

  emp_id NUMBER(10)
  emp_name VARCHAR2(20)

  salary NUMBER(10,2)


  可以通过下面的语句查询重复的记录:
  SQL> select * from employee;

  EMP_ID EMP_NAME SALARY

  1 sunshine 10000

  1 sunshine 10000

  2 semon 20000

  2 semon 20000

  3 xyz 30000

  2 semon 20000

  SQL> select distinct * from employee;

  EMP_ID EMP_NAME SALARY

  1 sunshine 10000

  2 semon 20000


  3 xyz 30000

  SQL> select * from employee group by emp_id,emp_name,salary having count (*)>1

  EMP_ID EMP_NAME SALARY

  1 sunshine 10000

  2 semon 20000

  SQL> select * from employee e1 

  where rowid in (select max(rowid) from employe e2 
  where e1.emp_id=e2.emp_id and 

  e1.emp_name=e2.emp_name and e1.salary=e2.salary);


  EMP_ID EMP_NAME SALARY

  1 sunshine 10000

  3 xyz 30000

  2 semon 20000 


  2. 删除的几种方法:

  (1)通过建立临时表来实现

  SQL>create table temp_emp as (select distinct * from employee) 

  SQL> truncate table employee; (清空employee表的数据)



  SQL> insert into employee select * from temp_emp; (再将临时表里的内容插回来)


  ( 2)通过唯一rowid实现删除重复记录.在Oracle中,每一条记录都有一个rowid,rowid在整个数据库中是唯一的,rowid确定了每条记录是在Oracle中的哪一个数据文件、块、行上。在重复的记录中,可能所有列的内容都相同,但rowid不会相同,所以只要确定出重复记录中那些具有最大或最小rowid的就可以了,其余全部删除。

  SQL>delete from employee e2 where rowid not in (
  select max(e1.rowid) from employee e1 where 

  e1.emp_id=e2.emp_id and e1.emp_name=e2.emp_name and e1.salary=e2.salary);--这里用min(rowid)也可以。

  SQL>delete from employee e2 where rowid <(
  select max(e1.rowid) from employee e1 where 
  e1.emp_id=e2.emp_id and e1.emp_name=e2.emp_name and e1.salary=e2.salary);


  (3)也是通过rowid,但效率更高。

  SQL>delete from employee where rowid not in (
  select max(t1.rowid) from employee t1 group by t1.emp_id,t1.emp_name,t1.salary);--这里用min(rowid)也可以。


  EMP_ID EMP_NAME SALARY

  1 sunshine 10000

  3 xyz 30000

  2 semon 20000

 

--检索所有重复列的整条记录 --效率不高 --每一条记录所有字段去本表检索 如果检索的条目大于1那么显示出来
select e1.*
from employee e1
where ( select count(*)
        from employee e2
        where
        e1.emp_id=e2.emp_id
    and e1.emp_name=e2.emp_name
    and e1.salary=e2.salary
      ) > 1
order by e1.emp_id,e1.emp_name,e1.salary

 

--稍微比那个好点有限  --显示所有重复记录,没有那些不重复的 --先group by 所有字段,找到分组后数目大于1的所有字段,然后作为连接字段去与原表连接,然后显示原表重复记录的整条记录

select   s2.*

from ( 

select  e1.emp_id,e1.emp_name,e1.salary

from employee e1

group by e1.emp_id,e1.emp_name,e1.salary

having count(*) > 1
)s1,employee s2

where s1.emp_id = s2.emp_id

and     s1.emp_name = s2.emp_name

and     s1.salary = s2.salary

 

--以上是用的一条记录完全重复的情况下连接字段用所有的字段,如果需求是指定特定列重复那么用特定列来做为连接字段或者是分组字段

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值