【sql】删除重复的邮件 Delete Duplicate Emails

最新推荐文章于 2021-07-24 10:03:00 发布

weixin_34204722

最新推荐文章于 2021-07-24 10:03:00 发布

阅读量190

点赞数

原文链接：https://my.oschina.net/liyurong/blog/1572806

版权

为什么80%的码农都做不了架构师？>>>

问题：

Write a SQL query to delete all duplicate email entries in a table named Person, keeping only unique emails based on its smallest Id.

+----+------------------+
| Id | Email            |
+----+------------------+
| 1  | john@example.com |
| 2  | bob@example.com  |
| 3  | john@example.com |
+----+------------------+
Id is the primary key column for this table.

For example, after running your query, the above Person table should have the following rows:

+----+------------------+
| Id | Email            |
+----+------------------+
| 1  | john@example.com |
| 2  | bob@example.com  |
+----+------------------+

解决：

① 可以首先找出所有不重复的邮箱，然后取个反就是重复的邮箱，都删掉即可，那么我们如何找出所有不重复的邮箱呢，我们可以按照邮箱群组起来，然后用Min关键字挑出较小的，然后取补集删除即可。962ms

DELETE FROM Person
WHERE Id NOT IN
(SELECT Id FROM
(SELECT MIN(Id) Id FROM Person GROUP BY Email) p
);

② 使用内交让两个表以邮箱关联起来，然后把相同邮箱且Id大的删除掉；954ms

DELETE p2 FROM Person p1 JOIN Person p2
ON p2.Email = p1.Email WHERE p2.Id > p1.Id;

③ 直接用where将两表关联起来；1444ms。

DELETE p2 FROM Person p1,Person p2
WHERE p1.Email = p2.Email AND p2.Id > p1.Id;

转载于:https://my.oschina.net/liyurong/blog/1572806