编写一个 SQL 查询,来删除 Person 表中所有重复的电子邮箱,重复的邮箱里只保留 Id 最小 的那个。
±—±-----------------+
| Id | Email |
±—±-----------------+
| 1 | john@example.com |
| 2 | bob@example.com |
| 3 | john@example.com |
±—±-----------------+
Id 是这个表的主键。
例如,在运行你的查询语句之后,上面的 Person 表应返回以下几行:
±—±-----------------+
| Id | Email |
±—±-----------------+
| 1 | john@example.com |
| 2 | bob@example.com |
±—±-----------------+
答案一:
将此表与它自身电子邮箱列中连接起来,找到其他记录中具有相同电子邮件地址的更大Id,去重后作为临时表,然后再筛选出相同电子邮件地址的id,然后删除即可。
delete from Person
where id in
( SELECT id from (SELECT distinct p.id as id FROM Person p,Person s where p.Email=s.Email AND p.Id>S.Id ) as temp);
答案二:
根据Email分组,筛选出Id最小的,然后再筛选出Id不在最小的Id集合里的记录,然后删除即可。
delete from Person
where Id not in
(
SELECT temp.minId
From(
select min(Id) as minId
from Person
group by Email
) as temp
)