数据库中经常会有一些重复的数据,今天来总结下如何删除重复的数据,只保留一条吧。
直接上SQL可能会一头雾水,我们还是先来理清楚思路,再看SQL就明白了。
0、建立一个测试表
1、首先找到某个字段重复的数据
select name,count(name) from test group by name;#按name分组
select name,count(name) from test group by name having count(name) > 1;#找出name重复的数据
2、删除重复的数据(谨慎操作会删除所有重复的数据)
delete from test where name in
(select name from test group by name having count(name) >1);
如果直接这样操作会报错:
You can’t specify target table ‘test’ for update in FROM clause
原因:
如果子查询的 from 子句和更新、删除对象使用同一张表,会出现上述错误。
解决方案:
通过给 from 子句中的结果集起别名。
delete from test where name in
(
select * from (
select name from test group by name having count(name) >1
) t1
);
3、删除重复的数据并保留一条
查找到需要保留的数据的id,这里根据条件最小id来保留,也可以根据实际要求保留
select min(id) from test group by name having count(name) >1; #查找需要保留的id
结合上面SQL,排除需要保留的数据,最终SQL如下:
delete from test where name in
(
select * from (
select name from test group by name having count(name) >1
) t1
)
and id not in
(
select * from (
select min(id) from test group by name having count(name) >1
) t2
);
这样就会删除所有重复的数据,并保留一条数据下来。
思路总结:通过字段找到重复数据,根据id或者其他条件来找到保留需要的数据,删除剩余重复的数据。