将单词中的字母排序可以很便捷的知道两个单词是不是变位词,所以,可以定义一个哈希表,其键是排序后的字符串,其值是一组变位词。
class Solution {
public List<List<String>> groupAnagrams(String[] strs) {
// 创建一个 HashMap,用于存储变位词组
Map<String, List<String>> map = new HashMap<>();
// 遍历输入的每个字符串
for (String str : strs) {
// 将字符串转换为字符数组
char[] arr = str.toCharArray();
// 对字符数组进行排序
Arrays.sort(arr);
// 将排序后的字符数组转换为字符串
String sorted = arr.toString();
// 如果 map 中没有该排序后的字符串,则添加一个新的列表
map.putIfAbsent(sorted, new ArrayList<String>());
// 将原始字符串添加到对应的变位词组列表中
map.get(sorted).add(str);
}
// 返回所有变位词组组成的列表
return new ArrayList<>(map.values());
}
}
其实上述代码存在一个错误。在String sorted = arr.toString这里,arr.toString() 返回的是数组对象的哈希码表示形式,而不是数组内容的字符串表示。这是因为对于数组, toString() 方法是从 Object 类继承来的默认实现,并没有重写,它返回的是类名和对象的哈希码,并不适用于数组内容的字符串化表示。
char[] arr = {'e', 'a', 't'};
String str = arr.toString();
System.out.println(str);
这段代码的输出是类似 [C@1b6d3586 这样的字符串,这里的 [C 表示这是一个字符数组,而 1b6d3586 是该数组对象的哈希码的无符号十六进制表示。
不同的字符数组对象会有不同的哈希码,即使它们的内容相同,它们仍然是不同的对象,具有不同的内存地址,所以就导致相同的变位词不会被分组到同一个列表中。运行结果自然也是不正确的。
正确代码如下:
class Solution {
public List<List<String>> groupAnagrams(String[] strs) {
Map<String, List<String>> map = new HashMap<>();
for(String str : strs){
char[] arr = str.toCharArray();
Arrays.sort(arr);
String sorted = new String(arr);
map.putIfAbsent(sorted,new ArrayList<String>());
map.get(sorted).add(str);
}
return new ArrayList<>(map.values());
}
}
另一种方法是将每个字母映射到一个质数上,‘a'映射到2,’b‘映射到3,以此类推。这样每个单词的字母对应的数字相乘可以得到一个数字,而因为因子都是质数,所以只有同一组变位数它们的数字才相同,不互为变位词的两个单词一定会映射到不同的数字。
class Solution {
public List<List<String>> groupAnagrams(String[] strs) {
// 将字母映射到质数
int[] primeNumbers = {
2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71,
73, 79, 83, 89, 97, 101
};
Map<Long, List<String>> map = new HashMap<>();
for (String str : strs) {
long product = 1;
for (char c : str.toCharArray()) {
product *= primeNumbers[c - 'a'];
}
// 将当前单词加入相应的列表
map.putIfAbsent(product, new ArrayList<String>());
map.get(product).add(str);
}
return new ArrayList<>(map.values());
}
}
不过该方法有溢出风险,当单词很长时,乘积结果就可能很大。