LeetCode 721. 账户合并 | Python

最新推荐文章于 2024-07-15 14:52:09 发布

"大梦三千秋

最新推荐文章于 2024-07-15 14:52:09 发布

阅读量430

点赞数 1

分类专栏： LeetCode 文章标签： python leetcode 并查集账号合并

本文链接：https://blog.csdn.net/weixin_45642918/article/details/112910871

版权

LeetCode 专栏收录该内容

247 篇文章 2 订阅

订阅专栏

721. 账户合并

题目来源：力扣（LeetCode）https://leetcode-cn.com/problems/accounts-merge/

题目

给定一个列表 accounts，每个元素 accounts[i] 是一个字符串列表，其中第一个元素 accounts[i][0] 是 名称 (name)，其余元素是 emails 表示该账户的邮箱地址。

现在，我们想合并这些账户。如果两个账户都有一些共同的邮箱地址，则两个账户必定属于同一个人。请注意，即使两个账户具有相同的名称，它们也可能属于不同的人，因为人们可能具有相同的名称。一个人最初可以拥有任意数量的账户，但其所有账户都具有相同的名称。

合并账户后，按以下格式返回账户：每个账户的第一个元素是名称，其余元素是按顺序排列的邮箱地址。账户本身可以以任意顺序返回。

示例 1：

输入：
accounts = [["John", "johnsmith@mail.com", "john00@mail.com"], ["John", "johnnybravo@mail.com"], ["John", "johnsmith@mail.com", "john_newyork@mail.com"], ["Mary", "mary@mail.com"]]
输出：
[["John", 'john00@mail.com', 'john_newyork@mail.com', 'johnsmith@mail.com'],  ["John", "johnnybravo@mail.com"], ["Mary", "mary@mail.com"]]
解释：
第一个和第三个 John 是同一个人，因为他们有共同的邮箱地址 "johnsmith@mail.com"。 
第二个 John 和 Mary 是不同的人，因为他们的邮箱地址没有被其他帐户使用。
可以以任何顺序返回这些列表，例如答案 [['Mary'，'mary@mail.com']，['John'，'johnnybravo@mail.com']，
['John'，'john00@mail.com'，'john_newyork@mail.com'，'johnsmith@mail.com']] 也是正确的。

提示：

accounts的长度将在[1，1000]的范围内。
accounts[i]的长度将在[1，10]的范围内。
accounts[i][j]的长度将在[1，30]的范围内。

解题思路

思路：并查集

先审题，题中给定一个列表 $a c c o u n t s$ ，其中每个元素 $a c c o u n t s [i]$ 是一个字符串列表，这个字符串列表中的第一个元素 $a c c o u n t s [i] [0]$ 是用户名称，而剩余的元素则都为邮箱地址。

题目说明：

两个账户都有共同邮箱地址时，两个账户属于同一个人。
但是，两个账户拥有相同名称并不能代表两个账户就是同一人。因为用户名称可能相同。

题目最终要求： 合并账户（确定属于同一人进行合并），然后按照如下格式返回：

每个账户的第一个元素是名称；
其余元素为邮箱地址，按照字符 $\rm{ASCII}$ 顺序排列；

其中，返回的账号本身顺序不做规定。

首先根据 题目说明，我们可以发现只有当两个账户存在共同的邮箱地址时，才能够判定这两个账户是同属于一个人的，也就说，题意其实是要求找到哪些邮箱地址是属于同一个人的，我们可以考虑使用并查集。

涉及的变量（部分）：

$email\_to\_index$ ：字典，邮箱地址对应每个账户的索引编号；
$index\_to\_email$ ：字典，索引编号对应同个账户的所有邮箱地址。

这道题，根据索引编号进行合并，具体的思路如下：

首先初始化每个账户为单独 1 个连通分量；
遍历 $a c c o u n t s$ 列表中的每个账户，判断是否有邮箱地址出现重复：
- 当不重复时，每个账户下的邮箱地址，必定属于同一个连通分量，初始字典 $email\_to\_index$ 邮箱地址对应当前账户的索引。
- 当出现邮箱地址重复时，根据索引编号进行合并。
当合并完成后，将属于同个连通分量的账户中所有邮箱地址存放在一个列表中，由字典 $index\_to\_index$ 存储，键为索引编号，值为同个账户的所有邮箱地址（类型：列表）。
最终按照格式进行合并存放至返回列表中进行返回。

这里以示例 1，用图示的形式展示下大致的过程，如下：

图示 1

具体代码实现如下。

class UnionFind:
    """并查集
    """
    def __init__(self, n):
        self.parent = [i for i in range(n)]
    
    def find(self, x):
        if x != self.parent[x]:
            self.parent[x] = self.find(self.parent[x])
        return self.parent[x]
    
    def union(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)
        if x_root != y_root:
            self.parent[x_root] = y_root

class Solution:
    def accountsMerge(self, accounts: List[List[str]]) -> List[List[str]]:
        n = len(accounts)

        uf = UnionFind(n)

        email_to_index = {}

        for i in range(n):
            m = len(accounts[i])
            for j in range(1, m):
                email = accounts[i][j]
                if email not in email_to_index:
                    email_to_index[email] = i
                # 存在重复的邮箱地址时，合并
                else:
                    uf.union(i, email_to_index[email])
        
        # 上面的操作根据邮箱地址将属于同个账户进行合并
        # 现在将合并后的账户对应的所有邮箱地址放到一个列表中
        index_to_email = collections.defaultdict(list)
        for email, index in email_to_index.items():
            index_to_email[uf.find(index)].append(email)
        
        ans = []
        # 根据格式进行合并返回
        for index, email in index_to_email.items():
            ans.append([accounts[index][0]]+sorted(email))
        
        return ans