oracle 删除重复数据你想不到的方法大全-开发系列（六）

最新推荐文章于 2021-12-16 22:22:15 发布

果木

最新推荐文章于 2021-12-16 22:22:15 发布

阅读量1.3k

点赞数

分类专栏： oracle 文章标签： delete group by row_number over rowid 删除重复数据

本文链接：https://blog.csdn.net/xiaohai798/article/details/45367967

版权

oracle 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

适合初学者阅读

引：

我们在做数据库开发用 pl sql 加工数据时，经常会遇到需要去除重复脏数据的情况，所以特地对此做个简单的总结，以便以后用到回顾。

重复数据分为整条记录重复和某个字段重复，删除目标分为重复数据全删除和重复数据删除留一条。

解决：

1 distinct 删除某字段所有重复的数据

假设要去重的字段为b 表为 a 先建个临时表a_temp，把select distinct a.b 的数据放入到a_temp，然后用delete from a where b in (select b from a_temp)

2 删除某个字段重复数据但是留下最小rowid的那条（即还留一条且不重复）

delete from wh_td2 a
   where a.rowid > (select min(b.rowid)
                      from wh_td2 b
                     where a.processinstid = b.processinstid)

3 group by 删除某字段所有重复的数据

delete from wh_td2 a
   where a.processinstid > (select b.processinstid
                      from wh_td2 b
                     group by  b.processinstid having count(1)>1)

4 row_number over() 删除某字段所有重复的数据

下面的语句是查询出 object_id 重复的语句，partition 分组跟group by 分组的区别是 partition分组后可以看到组内成员的信息，而group by

只能看到组的总统计信息。

select t.object_id,
       row_number() over(partition by t.object_id order by t.object_id) del_flag
  from scott.dba_objects_bak t;

删除语句：

delete from scott.dba_objects_bak
   where object_id in (select object_id
                         from (select t.object_id,
                                      row_number() over(partition by t.object_id order by t.object_id) as del_flag
                                 from scott.dba_objects_bak t)where del_flag > 1 );