721. 账户合并
题目来源:力扣(LeetCode)https://leetcode-cn.com/problems/accounts-merge/
题目
给定一个列表 accounts
,每个元素 accounts[i]
是一个字符串列表,其中第一个元素 accounts[i][0]
是 名称 (name),其余元素是 emails 表示该账户的邮箱地址。
现在,我们想合并这些账户。如果两个账户都有一些共同的邮箱地址,则两个账户必定属于同一个人。请注意,即使两个账户具有相同的名称,它们也可能属于不同的人,因为人们可能具有相同的名称。一个人最初可以拥有任意数量的账户,但其所有账户都具有相同的名称。
合并账户后,按以下格式返回账户:每个账户的第一个元素是名称,其余元素是按顺序排列的邮箱地址。账户本身可以以任意顺序返回。
示例 1:
输入:
accounts = [["John", "johnsmith@mail.com", "john00@mail.com"], ["John", "johnnybravo@mail.com"], ["John", "johnsmith@mail.com", "john_newyork@mail.com"], ["Mary", "mary@mail.com"]]
输出:
[["John", 'john00@mail.com', 'john_newyork@mail.com', 'johnsmith@mail.com'], ["John", "johnnybravo@mail.com"], ["Mary", "mary@mail.com"]]
解释:
第一个和第三个 John 是同一个人,因为他们有共同的邮箱地址 "johnsmith@mail.com"。
第二个 John 和 Mary 是不同的人,因为他们的邮箱地址没有被其他帐户使用。
可以以任何顺序返回这些列表,例如答案 [['Mary','mary@mail.com'],['John','johnnybravo@mail.com'],
['John','john00@mail.com','john_newyork@mail.com','johnsmith@mail.com']] 也是正确的。
提示:
accounts
的长度将在[1,1000]
的范围内。accounts[i]
的长度将在[1,10]
的范围内。accounts[i][j]
的长度将在[1,30]
的范围内。
解题思路
思路:并查集
先审题,题中给定一个列表 a c c o u n t s accounts accounts,其中每个元素 a c c o u n t s [ i ] accounts[i] accounts[i] 是一个字符串列表,这个字符串列表中的第一个元素 a c c o u n t s [ i ] [ 0 ] accounts[i][0] accounts[i][0]是用户名称,而剩余的元素则都为邮箱地址。
题目说明:
- 两个账户都有共同邮箱地址时,两个账户属于同一个人。
- 但是,两个账户拥有相同名称并不能代表两个账户就是同一人。因为用户名称可能相同。
题目最终要求: 合并账户(确定属于同一人进行合并),然后按照如下格式返回:
- 每个账户的第一个元素是名称;
- 其余元素为邮箱地址,按照字符 A S C I I \rm{ASCII} ASCII 顺序排列;
其中,返回的账号本身顺序不做规定。
首先根据 题目说明,我们可以发现只有当两个账户存在共同的邮箱地址时,才能够判定这两个账户是同属于一个人的,也就说,题意其实是要求找到哪些邮箱地址是属于同一个人的,我们可以考虑使用并查集。
涉及的变量(部分):
- e m a i l _ t o _ i n d e x email\_to\_index email_to_index: 字典,邮箱地址对应每个账户的索引编号;
- i n d e x _ t o _ e m a i l index\_to\_email index_to_email:字典,索引编号对应同个账户的所有邮箱地址。
这道题,根据索引编号进行合并,具体的思路如下:
- 首先初始化每个账户为单独 1 个连通分量;
- 遍历
a
c
c
o
u
n
t
s
accounts
accounts 列表中的每个账户,判断是否有邮箱地址出现重复:
- 当不重复时,每个账户下的邮箱地址,必定属于同一个连通分量,初始字典 e m a i l _ t o _ i n d e x email\_to\_index email_to_index 邮箱地址对应当前账户的索引。
- 当出现邮箱地址重复时,根据索引编号进行合并。
- 当合并完成后,将属于同个连通分量的账户中所有邮箱地址存放在一个列表中,由字典 i n d e x _ t o _ i n d e x index\_to\_index index_to_index 存储,键为索引编号,值为同个账户的所有邮箱地址(类型:列表)。
- 最终按照格式进行合并存放至返回列表中进行返回。
这里以示例 1,用图示的形式展示下大致的过程,如下:
具体代码实现如下。
class UnionFind:
"""并查集
"""
def __init__(self, n):
self.parent = [i for i in range(n)]
def find(self, x):
if x != self.parent[x]:
self.parent[x] = self.find(self.parent[x])
return self.parent[x]
def union(self, x, y):
x_root = self.find(x)
y_root = self.find(y)
if x_root != y_root:
self.parent[x_root] = y_root
class Solution:
def accountsMerge(self, accounts: List[List[str]]) -> List[List[str]]:
n = len(accounts)
uf = UnionFind(n)
email_to_index = {}
for i in range(n):
m = len(accounts[i])
for j in range(1, m):
email = accounts[i][j]
if email not in email_to_index:
email_to_index[email] = i
# 存在重复的邮箱地址时,合并
else:
uf.union(i, email_to_index[email])
# 上面的操作根据邮箱地址将属于同个账户进行合并
# 现在将合并后的账户对应的所有邮箱地址放到一个列表中
index_to_email = collections.defaultdict(list)
for email, index in email_to_index.items():
index_to_email[uf.find(index)].append(email)
ans = []
# 根据格式进行合并返回
for index, email in index_to_email.items():
ans.append([accounts[index][0]]+sorted(email))
return ans
欢迎关注
公众号 【书所集录】
如有错误,烦请指出,欢迎指点交流。若觉得写得还不错,麻烦点个赞👍,谢谢。