一、题目
表:
Person
+-------------+---------+ | Column Name | Type | +-------------+---------+ | id | int | | email | varchar | +-------------+---------+ id 是该表的主键(具有唯一值的列)。 此表的每一行都包含一封电子邮件。电子邮件不包含大写字母。编写解决方案来报告所有重复的电子邮件。 请注意,可以保证电子邮件字段不为 NULL。
以 任意顺序 返回结果表。
二、示例
输入: Person 表: +----+---------+ | id | email | +----+---------+ | 1 | a@b.com | | 2 | c@d.com | | 3 | a@b.com | +----+---------+ 输出: +---------+ | Email | +---------+ | a@b.com | +---------+ 解释: a@b.com 出现了两次。
三、答案
3.1、having +聚合函数
select email
from Person
group by email
having count(id)>1;
使用了 GROUP BY 将数据按照 email 地址进行分组,并使用聚合函数 COUNT 统计每个分组内 email 地址出现的次数。最后通过 HAVING 子句筛选出出现次数大于 1 的分组,即出现了多次的 email 地址。
3.2、自链接
select DISTINCT p1.Email
from Person p1, Person p2
where p1.Email = p2.Email and p1.Id != p2.Id;
通过distinct对数据进行去重,当p1的邮箱在p2中出现,且p1、p2的ID不一致。
3.3、子表查询
select Email
from (select count(1) as t, Email from Person group by Email) r
where r.t > 1;