字母异位词分组

最新推荐文章于 2024-09-10 20:37:54 发布

不过是条河鱼

最新推荐文章于 2024-09-10 20:37:54 发布

阅读量726

点赞数 19

分类专栏：经典算法题文章标签：数据结构算法哈希表

本文链接：https://blog.csdn.net/w17319185551/article/details/139204644

版权

经典算法题专栏收录该内容

35 篇文章 0 订阅

订阅专栏

将单词中的字母排序可以很便捷的知道两个单词是不是变位词，所以，可以定义一个哈希表，其键是排序后的字符串，其值是一组变位词。

class Solution {
    public List<List<String>> groupAnagrams(String[] strs) {
        // 创建一个 HashMap，用于存储变位词组
        Map<String, List<String>> map = new HashMap<>();
        
        // 遍历输入的每个字符串
        for (String str : strs) {
            // 将字符串转换为字符数组
            char[] arr = str.toCharArray();            
            // 对字符数组进行排序
            Arrays.sort(arr);           
            // 将排序后的字符数组转换为字符串
            String sorted = arr.toString();
            
            // 如果 map 中没有该排序后的字符串，则添加一个新的列表
            map.putIfAbsent(sorted, new ArrayList<String>());   
            // 将原始字符串添加到对应的变位词组列表中
            map.get(sorted).add(str);
        }        
        // 返回所有变位词组组成的列表
        return new ArrayList<>(map.values());
    }
}

其实上述代码存在一个错误。在String sorted = arr.toString这里，arr.toString() 返回的是数组对象的哈希码表示形式，而不是数组内容的字符串表示。这是因为对于数组， toString() 方法是从 Object 类继承来的默认实现，并没有重写，它返回的是类名和对象的哈希码，并不适用于数组内容的字符串化表示。

char[] arr = {'e', 'a', 't'};
String str = arr.toString();
System.out.println(str);

这段代码的输出是类似 [C@1b6d3586 这样的字符串，这里的 [C 表示这是一个字符数组，而 1b6d3586 是该数组对象的哈希码的无符号十六进制表示。

不同的字符数组对象会有不同的哈希码，即使它们的内容相同，它们仍然是不同的对象，具有不同的内存地址，所以就导致相同的变位词不会被分组到同一个列表中。运行结果自然也是不正确的。

正确代码如下：

class Solution {
    public List<List<String>> groupAnagrams(String[] strs) {
        Map<String, List<String>> map = new HashMap<>();
        for(String str : strs){
            char[] arr = str.toCharArray();
            Arrays.sort(arr);
            String sorted = new String(arr);
            map.putIfAbsent(sorted,new ArrayList<String>());
            map.get(sorted).add(str);
        }
        return new ArrayList<>(map.values());
    }
}

另一种方法是将每个字母映射到一个质数上，‘a'映射到2，’b‘映射到3，以此类推。这样每个单词的字母对应的数字相乘可以得到一个数字，而因为因子都是质数，所以只有同一组变位数它们的数字才相同，不互为变位词的两个单词一定会映射到不同的数字。

class Solution {
    public List<List<String>> groupAnagrams(String[] strs) {
        // 将字母映射到质数
        int[] primeNumbers = {
            2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 
            73, 79, 83, 89, 97, 101
        };

        Map<Long, List<String>> map = new HashMap<>();

        for (String str : strs) {
            long product = 1;
            for (char c : str.toCharArray()) {
                product *= primeNumbers[c - 'a'];
            }
            // 将当前单词加入相应的列表
            map.putIfAbsent(product, new ArrayList<String>());
            map.get(product).add(str);
        }
        
        return new ArrayList<>(map.values());
    }
}

不过该方法有溢出风险，当单词很长时，乘积结果就可能很大。

不过是条河鱼

关注

19
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
字母异位词分组

这样每个单词的字母对应的数字相乘可以得到一个数字，而因为因子都是质数，所以只有同一组变位数它们的数字才相同，不互为变位词的两个单词一定会映射到不同的数字。不同的字符数组对象会有不同的哈希码，即使它们的内容相同，它们仍然是不同的对象，具有不同的内存地址，所以就导致相同的变位词不会被分组到同一个列表中。运行结果自然也是不正确的。这段代码的输出是类似 [C@1b6d3586 这样的字符串，这里的 [C 表示这是一个字符数组，而 1b6d3586 是该数组对象的哈希码的无符号十六进制表示。
复制链接

扫一扫