关于oracle查找重复数据

最近做报表的优化,在一个数据量上千万条的表里面,给客户号去重复。因为这个表里面重要的东西比较多,手贱删掉了估计我就要滚蛋了,所以建了临时表,取出需要日期的数据放进去

CREATE TABLE 临时表 AS
(select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)

但是我删除数据的话肯定不是把所有的数据都删掉,要保留重复数据中的一条,就要使用oracle默认的一个rowid字段,只需要保留重复字段中rowid最大的一条即可

delete from 表名 a
where a.rowid !=
(
   select max(b.rowid) from 表名 b
   where a.字段1 = b.字段1 and
   a.字段2 = b.字段2
)
这种方法适合部分重复的去重,

对于完全重复的数据,可以使用distinct查询,将结果集插入临时表,再将临时表中的替换给源表


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值