测试 表结构信息如下 id为主键
思路 : 根据name分组,查找出id最小的。然后再查找id不包含刚才查出来的。这样就查询出所有的重复数据(除了id最小的那行)
第一步:根据name 分组
SELECT MIN(id) as minid,name FROM test GROUP BY `name`;
第二步:查找id不包含上面出的数据 注意下面语句会报错
DELETE FROM test where id not in (SELECT MIN(id) as minid,name FROM test GROUP BY `name`);
执行后会出现 错误信息:> 1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'id not in (SELECT MIN(id) as minid,name FROM test GROUP BY `name`)' at line 5
原因是:更新这个表的同时又查询了这个表,查询这个表的同时又去更新了这个表,可以理解为死锁。MySQL不支持这种更新查询同一张表的操作
解决办法:把要更新的列数据查询出来做为一个第三方临时表,然后在筛选更新。
最终SQL如下
DELETE
FROM
test
WHERE
id NOT IN ( SELECT t.minid FROM ( SELECT MIN( id ) AS minid, name FROM test GROUP BY `name` ) AS t );
> 执行结果如下
> Affected rows: 3
> 时间: 0.041s
再次查看数据,重复数据已经删除了
SELECT * FROM test;