对变形词字符串分组
题目描述:
如果str1和str2包含的字符种类一样,并且每种字符的个数也 一样,那么str1和str2算作变形词。
给定一个字符类型的数组,请把变形词分组。
比如 输入: [“eat”, “tea”, “tan”, “ate”, “nat”, “bat”]
输出: [ [“ate”, “eat”,“tea”], [“nat”,“tan”], [“bat”] ]
注意:所有的字符都是小写。
题目难度:
题目思路:
思路一:
1、先将遍历的每个字符串转为char数组,然后进行排序,将排好序的数组再转为字符串。
2、将该字符串放到HashMap中,其中key为该有序字符串,value就为原字符串链表。
3、最后对value进行遍历,求出各个分组。
代码实现:
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashMap;
import java.util.List;
/**
* Created by Zhaoyang Ge on 2018/9/18.
*/
public static List<List<String>> groupAnagrams1(String[] strs) {
if (strs == null || strs.length == 0) {
return null;
}
HashMap<String, List<String>> map = new HashMap<>();
for (String str : strs) {
char[] chs = str.toCharArray();
Arrays.sort(chs);
String strSort = String.valueOf(chs);
if (!map.containsKey(strSort)) {
map.put(strSort,new ArrayList<>());
}
map.get(strSort).add(str);
}
List<List<String>> res = new ArrayList<>();
for (List<String> list: map.values()){
res.add(list);
}
return res;
}
思路二:
考虑到思路一,将char数组进行排序时间复杂度的问题。
对于题目中出现的,每个字符的内容种类固定的时候,尽量对每个位置字符做文章。性能会更优!
思路二,采用的是生成26个长度的数组,来存储每个字符串对应字符出现的次数,然后将该字符串所对应的次数用append连接起来,构成key为字符次数,value就为该字符串。因此相同字符种类将被存储到同一个链表里。
代码实现:
public static List<List<String>> groupAnagrams2(String[] strs) {
if (strs == null || strs.length == 0) {
return null;
}
HashMap<String, List<String>> map = new HashMap<>();
for (String str : strs) {
int[] chs = new int[26];
for (char cha : str.toCharArray()) {
chs[cha - 'a']++; //记录该字符串中每个字符出现的次数
}
StringBuilder stringBuilder = new StringBuilder();
for (int i = 0; i < 26; i++) {
stringBuilder.append(chs[i]).append("_"); //对遍历的字符串,构成新的key
}
if (!map.containsKey(stringBuilder.toString())){
map.put(stringBuilder.toString(),new ArrayList<>());
}
map.get(stringBuilder.toString()).add(str);
}
List<List<String>> res = new ArrayList<>();
for (List<String> list: map.values()){
res.add(list);
}
return res;
}
总结:
思路一与思路二的区别在于:
思路一是将字符串转为char型数组之后,对数组里面的元素进行排序,组成新的字符串作为key。
思路二是将字符串转为char型数组之后,对对数组里面的字符遍历,计算出每个元素出现的次数并放入到int型数组中。
以后遇到题目中,如果里面元素的种类固定,就应该想到用思路二的思想去求解。