假设有一样一张数据库表TNames,有两个字段 ID:主键 int;Name:nvarchar(50)
TNames表中有一些重复数据行 例如:
ID Name
---------------------------
1 wang
2 wang
3 lee
4 lee
5 lee
6 zhang
7 zhang
8 zhao
现要求从这张表删除重复的记录,结果要求为:数据表中最后剩下wang、lee、zhang、zhao四条不重的记录。
解题思路:1)首先要找到重复的Name 执行Sql为
select Name from TNamesgroup by Name having count(*)>1
2)其次根据上一步的Sql找到每一组重复Name的最大ID或最小ID 执行Sql为
select max(id) from TNames where Name in(select Name from TNames group by Name having count(*)>1) group by Name
3)根据上两步查询删除TNames表中条件为 Name 包括在第一步执行Sql中,且ID不包括第二步执行Sql中的记录,具体Sql语句为
delete from TNames where id not in(
select max(id) from TNames where name in(
select name from TNames group by name having count(*)>1) group by name) and name in (select name from TNames group by name having count(*)>1)
经过第3步的执行,便可以从数据表中清除重复的记录。