Leetcode每日一题 20240715 721.账户合并

Huayi-Plus

于 2024-07-15 23:43:44 发布

阅读量529

点赞数 22

分类专栏： Leetcode每日一题文章标签： leetcode 算法职场和发展

本文链接：https://blog.csdn.net/2301_76443687/article/details/140451517

版权

Leetcode每日一题专栏收录该内容

13 篇文章 1 订阅

订阅专栏

题目描述

给定一个列表 accounts，每个元素 accounts[i] 是一个字符串列表，其中第一个元素 accounts[i][0] 是名称 (name)，其余元素是 emails 表示该账户的邮箱地址。

现在，我们想合并这些账户。如果两个账户都有一些共同的邮箱地址，则两个账户必定属于同一个人。请注意，即使两个账户具有相同的名称，它们也可能属于不同的人，因为人们可能具有相同的名称。一个人最初可以拥有任意数量的账户，但其所有账户都具有相同的名称。

合并账户后，按以下格式返回账户：每个账户的第一个元素是名称，其余元素是按字符 ASCII 顺序排列的邮箱地址。账户本身可以以任意顺序返回。
721.账户合并

测试案例及提示

示例 1：
输入：accounts = [[“John”, “johnsmith@mail.com”, “john00@mail.com”], [“John”, “johnnybravo@mail.com”], [“John”, “johnsmith@mail.com”, “john_newyork@mail.com”], [“Mary”, “mary@mail.com”]]
输出：[[“John”, ‘john00@mail.com’, ‘john_newyork@mail.com’, ‘johnsmith@mail.com’], [“John”, “johnnybravo@mail.com”], [“Mary”, “mary@mail.com”]]
解释：
第一个和第三个 John 是同一个人，因为他们有共同的邮箱地址 “johnsmith@mail.com”。
第二个 John 和 Mary 是不同的人，因为他们的邮箱地址没有被其他帐户使用。
可以以任何顺序返回这些列表，例如答案 [[‘Mary’，‘mary@mail.com’]，[‘John’，‘johnnybravo@mail.com’]，
[‘John’，‘john00@mail.com’，‘john_newyork@mail.com’，‘johnsmith@mail.com’]] 也是正确的。

示例 2：
输入：accounts = [[“Gabe”,“Gabe0@m.co”,“Gabe3@m.co”,“Gabe1@m.co”],[“Kevin”,“Kevin3@m.co”,“Kevin5@m.co”,“Kevin0@m.co”],[“Ethan”,“Ethan5@m.co”,“Ethan4@m.co”,“Ethan0@m.co”],[“Hanzo”,“Hanzo3@m.co”,“Hanzo1@m.co”,“Hanzo0@m.co”],[“Fern”,“Fern5@m.co”,“Fern1@m.co”,“Fern0@m.co”]]
输出：[[“Ethan”,“Ethan0@m.co”,“Ethan4@m.co”,“Ethan5@m.co”],[“Gabe”,“Gabe0@m.co”,“Gabe1@m.co”,“Gabe3@m.co”],[“Hanzo”,“Hanzo0@m.co”,“Hanzo1@m.co”,“Hanzo3@m.co”],[“Kevin”,“Kevin0@m.co”,“Kevin3@m.co”,“Kevin5@m.co”],[“Fern”,“Fern0@m.co”,“Fern1@m.co”,“Fern5@m.co”]]

提示：
1 <= accounts.length <= 1000
2 <= accounts[i].length <= 10
1 <= accounts[i][j].length <= 30
accounts[i][0] 由英文字母组成
accounts[i][j] (for j > 0) 是有效的邮箱地址

解题思路

读懂题意，题目需要使有相同邮箱号的用户合并起来，最好想到的方法是每个用户作为字典key，如何遍历每个的value，有相同的话就合并。但这样会出现“无限循环”的情况，也就是说可能合并之后，还是出现若干个同名用户，但邮箱地址是两两有相同的情况，这样就还需要再来n次……
而使用并查集的话，就不需要考虑重复判断的情况了，并查集根据一个父节点来划分不同的元素。
并查集入门可以参考：
图论——并查集(详细版)
并查集
回到题目，我们首先把邮箱进行索引化，email_to_index 和 email_to_name 分别用于存储每个邮箱的索引和对应的姓名，index 记录当前已分配的索引。
构建并查集，遍历，对于每个邮箱，如果还没出现在email_to_index ，就分配一个索引。使用union方法，把同一个姓名下的邮箱视为一个集合。然后使用find方法，查找每个邮箱的根节点。最后遍历email_groups，输出。
python

# 并查集类模板
class UnionFind:
    def __init__(self, n):
        self.parent = list(range(n)) 
        self.size = [1] * n

    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])
        return self.parent[x]

    def union(self, x, y):
        rootX = self.find(x)
        rootY = self.find(y)
        if rootX != rootY:
            if self.size[rootX] > self.size[rootY]:
                self.parent[rootY] = rootX
                self.size[rootX] += self.size[rootY]
            else:
                self.parent[rootX] = rootY
                self.size[rootY] += self.size[rootX]


class Solution:
    def accountsMerge(self, accounts: List[List[str]]) -> List[List[str]]:
        email_to_index = {}
        email_to_name = {}
        index = 0

        # 构建并查集和映射
        uf = UnionFind(len(accounts) * 10)  #  最多有10个email
        for acc in accounts:
            name = acc[0]
            for email in acc[1:]:
                if email not in email_to_index:
                    email_to_index[email] = index
                    email_to_name[email] = name
                    index += 1
                uf.union(email_to_index[acc[1]], email_to_index[email])

        # 将所有连接的email分组
        email_groups = defaultdict(list)
        for email, index in email_to_index.items():
            root = uf.find(index)
            email_groups[root].append(email)

        # 按照要求格式化输出
        result = []
        for emails in email_groups.values():
            result.append([email_to_name[emails[0]]] + sorted(emails))

        return result