编写一个 SQL 查询,来删除 Person 表中所有重复的电子邮箱,重复的邮箱里只保留 Id 最小 的那个。
+----+------------------+ | Id | Email | +----+------------------+ | 1 | john@example.com | | 2 | bob@example.com | | 3 | john@example.com | +----+------------------+
Id 是这个表的主键。
例如,在运行你的查询语句之后,上面的 Person 表应返回以下几行:
+----+------------------+ | Id | Email | +----+------------------+ | 1 | john@example.com | | 2 | bob@example.com | +----+------------------+
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/delete-duplicate-emails
解题思路:根据题目所述,需要使用 delete 语句。
方法一的解题思路:执行语句需删除重复的电子邮箱,且重复的电子邮箱里只保留id最小的那个。即我们可以找到id最小的电子邮箱,使用not in语句将其他的记录删掉就可以了。按照Email对记录继续分组,并留下最小的id的电子邮箱记录,使用where语句中的not in,就可以直接删除了。至于为什么要再“多此一举”的再多些一个select *语句,是因为会报错。
描述: 如果子查询的 from 子句和更新、删除对象使用同一张表,会出现错误:
You can't specify target table 'Person' for update in FROM clause
解决方法: 通过给 from 子句中的结果集起别名
SQL语句:
方法一:
delete from Person where Id not in (select * from (select min(Id) from Person group by Email) as A)
方法二:
delete a from Person a, Person b where (a.Email = b.Email) and (a.Id>b.Id)