“日暮酒醒人已远,满天风雨下西楼”
序
在数据库的操作中,经常会遇到有重复的数据,并且这些重复的行是没用的数据,需要删除。我做了一个测试表,如下:
苹果和香蕉有重复的。
删除重复行
1. 使用not in 删除重复行,SQL语句如下:
DELETE FROM fruit_test
WHERE id NOT IN (SELECT MAX(id) as id
FROM fruit_test
GROUP BY name, price);
这里是根据名称和价格分组,拿到不重复数据的最大ID值,然后删除不在这最大ID值的行,即可删除重复行。如果该句MySQL中执行会出现You can't specify target table 'fruit_test' for update in FROM clause
错误,如下:
该问题也好解决,把not in 里面的SQL再嵌套一层即可:
DELETE FROM fruit_test
WHERE id NOT IN (
select id from (SELECT MAX(id) as id -- 嵌套一层已解决上面的报错
FROM fruit_test
GROUP BY name, price) a);
该方法的好处是,主流的数据库都支持这种语法。
2. 使用EXCEPT删除重复行
如果你使用的是SqlServer数据库,那么可以使用EXCEPT减去要留下的数据,SQL如下:
DELETE FROM fruit_test
WHERE id IN ( SELECT id -- 全部 rowid
FROM fruit_test
EXCEPT -- 减去
SELECT MAX(id) -- 要留下的 rowid
FROM fruit_test
GROUP BY name, price) ;
3. 使用minus删除重复行
minus和EXCEPT效果一样,只是EXCEPT用在sqlserver,minus用在oracle。SQL语句如下:
DELETE FROM fruit_test
WHERE id IN ( SELECT id
FROM fruit_test
minus
SELECT MAX(id)
FROM fruit_test
GROUP BY name, price) ;