题目描述
给定一个列表 accounts,每个元素 accounts[i] 是一个字符串列表,其中第一个元素 accounts[i][0] 是 名称 (name),其余元素是 emails 表示该账户的邮箱地址。
现在,我们想合并这些账户。如果两个账户都有一些共同的邮箱地址,则两个账户必定属于同一个人。请注意,即使两个账户具有相同的名称,它们也可能属于不同的人,因为人们可能具有相同的名称。一个人最初可以拥有任意数量的账户,但其所有账户都具有相同的名称。
合并账户后,按以下格式返回账户:每个账户的第一个元素是名称,其余元素是 按字符 ASCII 顺序排列 的邮箱地址。账户本身可以以 任意顺序 返回。
721.账户合并
测试案例及提示
示例 1:
输入:accounts = [[“John”, “johnsmith@mail.com”, “john00@mail.com”], [“John”, “johnnybravo@mail.com”], [“John”, “johnsmith@mail.com”, “john_newyork@mail.com”], [“Mary”, “mary@mail.com”]]
输出:[[“John”, ‘john00@mail.com’, ‘john_newyork@mail.com’, ‘johnsmith@mail.com’], [“John”, “johnnybravo@mail.com”], [“Mary”, “mary@mail.com”]]
解释:
第一个和第三个 John 是同一个人,因为他们有共同的邮箱地址 “johnsmith@mail.com”。
第二个 John 和 Mary 是不同的人,因为他们的邮箱地址没有被其他帐户使用。
可以以任何顺序返回这些列表,例如答案 [[‘Mary’,‘mary@mail.com’],[‘John’,‘johnnybravo@mail.com’],
[‘John’,‘john00@mail.com’,‘john_newyork@mail.com’,‘johnsmith@mail.com’]] 也是正确的。
示例 2:
输入:accounts = [[“Gabe”,“Gabe0@m.co”,“Gabe3@m.co”,“Gabe1@m.co”],[“Kevin”,“Kevin3@m.co”,“Kevin5@m.co”,“Kevin0@m.co”],[“Ethan”,“Ethan5@m.co”,“Ethan4@m.co”,“Ethan0@m.co”],[“Hanzo”,“Hanzo3@m.co”,“Hanzo1@m.co”,“Hanzo0@m.co”],[“Fern”,“Fern5@m.co”,“Fern1@m.co”,“Fern0@m.co”]]
输出:[[“Ethan”,“Ethan0@m.co”,“Ethan4@m.co”,“Ethan5@m.co”],[“Gabe”,“Gabe0@m.co”,“Gabe1@m.co”,“Gabe3@m.co”],[“Hanzo”,“Hanzo0@m.co”,“Hanzo1@m.co”,“Hanzo3@m.co”],[“Kevin”,“Kevin0@m.co”,“Kevin3@m.co”,“Kevin5@m.co”],[“Fern”,“Fern0@m.co”,“Fern1@m.co”,“Fern5@m.co”]]
提示:
1 <= accounts.length <= 1000
2 <= accounts[i].length <= 10
1 <= accounts[i][j].length <= 30
accounts[i][0] 由英文字母组成
accounts[i][j] (for j > 0) 是有效的邮箱地址
解题思路
读懂题意,题目需要使有相同邮箱号的用户合并起来,最好想到的方法是每个用户作为字典key,如何遍历每个的value,有相同的话就合并。但这样会出现“无限循环”的情况,也就是说可能合并之后,还是出现若干个同名用户,但邮箱地址是两两有相同的情况,这样就还需要再来n次……
而使用并查集的话,就不需要考虑重复判断的情况了,并查集根据一个父节点来划分不同的元素。
并查集入门可以参考:
图论——并查集(详细版)
并查集
回到题目,我们首先把邮箱进行索引化,email_to_index 和 email_to_name 分别用于存储每个邮箱的索引和对应的姓名,index 记录当前已分配的索引。
构建并查集,遍历,对于每个邮箱,如果还没出现在email_to_index ,就分配一个索引。使用union方法,把同一个姓名下的邮箱视为一个集合。然后使用find方法,查找每个邮箱的根节点。最后遍历email_groups,输出。
python
# 并查集类模板
class UnionFind:
def __init__(self, n):
self.parent = list(range(n))
self.size = [1] * n
def find(self, x):
if self.parent[x] != x:
self.parent[x] = self.find(self.parent[x])
return self.parent[x]
def union(self, x, y):
rootX = self.find(x)
rootY = self.find(y)
if rootX != rootY:
if self.size[rootX] > self.size[rootY]:
self.parent[rootY] = rootX
self.size[rootX] += self.size[rootY]
else:
self.parent[rootX] = rootY
self.size[rootY] += self.size[rootX]
class Solution:
def accountsMerge(self, accounts: List[List[str]]) -> List[List[str]]:
email_to_index = {}
email_to_name = {}
index = 0
# 构建并查集和映射
uf = UnionFind(len(accounts) * 10) # 最多有10个email
for acc in accounts:
name = acc[0]
for email in acc[1:]:
if email not in email_to_index:
email_to_index[email] = index
email_to_name[email] = name
index += 1
uf.union(email_to_index[acc[1]], email_to_index[email])
# 将所有连接的email分组
email_groups = defaultdict(list)
for email, index in email_to_index.items():
root = uf.find(index)
email_groups[root].append(email)
# 按照要求格式化输出
result = []
for emails in email_groups.values():
result.append([email_to_name[emails[0]]] + sorted(emails))
return result