SQLServer 删除表中的重复数据,只保留一条记录

  
 --创建临时表并向临时表中插入测试表Tmp中数据以及添加自增id:autoID
select identity(int,1,1) as autoID, * into #Tmp from test
select * from  #Tmp
--根据autoID删除临时表#tmp中的重复数据,只保留每组重复数据中的第一条 
  DELETE FROM #Tmp WHERE autoID IN(
   SELECT autoID  FROM
    (
        SELECT autoID,字段A
      ,字段B,OrderNo=ROW_NUMBER() OVER(PARTITION BY 字段A
      ,字段B ORDER BY GETDATE()) 
        FROM #Tmp 
    ) Tmp
    WHERE OrderNo>1
  );
--清除testtab表中的所有数据 
delete testtab; 
--向testtab表中插入#Tmp表中被处理过的数据 
insert into testtab select 字段A , 字段B from #Tmp; 
--删除临时表#Tmp 
drop table #Tmp;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SQL Server有多种方法可以高效地删除重复记录,通常使用的是聚集索引或其他唯一约束来识别唯一的行。这里有几个常见的策略: 1. **使用`DISTINCT`关键字**: 如果你知道要删除哪些列,你可以先创建一个临时表或视图,只包含不重复的组合,然后从原始表删除非唯一项。 ```sql DELETE T1 FROM YourTable T1 WHERE NOT EXISTS (SELECT 1 FROM ( SELECT DISTINCT Column1, Column2, ... FROM YourTable ) T2 WHERE T1.Column1 = T2.Column1 AND T1.Column2 = T2.Column2); ``` 2. **使用`GROUP BY`和`HAVING`**: 这种方法通过分组并检查每个组的数量来找出重复行,如果某个组有超过1条记录,则删除所有除了第一条之外的记录。 ```sql DELETE YourTable WHERE ID NOT IN ( SELECT MIN(ID) FROM YourTable GROUP BY Column1, Column2, ... HAVING COUNT(*) > 1 ); ``` 3. **利用`ROW_NUMBER()`窗口函数**: 如果你的数据库支持窗口函数,可以按照指定列排序,并保留每组的第一条记录。 ```sql WITH CTE AS ( SELECT *, ROW_NUMBER() OVER(PARTITION BY Column1, Column2, ... ORDER BY (SELECT NULL)) RN FROM YourTable ) DELETE FROM CTE WHERE RN > 1; ``` 4. **考虑使用分区**: 对于非常大的表,可以考虑按特定列分区,然后再分别处理每个分区内的重复记录。 无论哪种方法,都要谨慎操作,尤其是当数据量大时,因为删除操作通常是不可逆的。建议在实际操作前备份数据,并在测试环境验证。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值