使用sql语句删除数据库中重复的数据

在数据库中有一批数据,但是由于数据入库之前某些不当的操作引入了一些重复的数据,需要将这些重复的数据删除。数据的结构大概是下面的样子

CREATE TABLE [dbo].[aaa](
    [id] [int] IDENTITY(1,1) NOT NULL,
    [fileName] [varchar](50) NULL,
    [fileSize] [int] NULL,
 CONSTRAINT [PK_aaa] PRIMARY KEY CLUSTERED 
(
    [id] ASC
) 
)

其中fileName和FileSize重复的时候表示数据重复

按照fileName和fileSize进行分组
select fileSize,fileName from tb group by filesize,filename
找出最大的那条记录的id

上面的语句变成

select fileSize,fileName ,max(id) from tb group by filesize,filename
查找所有的id
select id from 
    (select fileSize,fileName ,max(id) id from tb group by filesize,filename ) a
删除重复的数据
delete from tb where id not in ( 
    select id from 
         (select fileSize,fileName ,max(id) id from tb group by filesize,filename ) a
)

现在完成了重复数据的删除,主要是利用了找出某个分组中最大的那个id,其中包括了所有不重复的id,然后使用not in将需要保留的排除。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值