692 前K个高频单词
字典树+桶排序思想
其实就是代码复杂,简单总结就是先把所有的单词用字典树给存起来,为啥要用字典树其实这里是有门道的,因为题目要求一个很重的就是当两个单词的出现的数量相同的时候,那么就要按照字母的先后的出现的顺序来排列。所以我们来遍历字典树的时候可以保证是按照字母的出现的顺序来访问的。如果看到这里依然没懂得什么意思,那么就要熟悉一下字典树这数据结构了。非常经典的一个数据结构。
我们构造好了字典树之后,我们通过遍历的方式来解决每个单词的数量的多少,然后把他们存到字符串的List的数组中,利用这些功能,我们就可以完成信息的归纳了,我这里说明一下,下标是出现的次数,而对应的坐标的数组的元素就是那些出现了相应次数的单词的总和,这里用的ArrayList来作为结合,为的就是要保证总和中的结果是严格按照字母出现的顺序来排列的。
(1)构造字典树
(2)遍历字典树
(3)从字典树中归纳数据:单词的出现的次数,
(4)根据归纳的数据来逐个找出想要的结果。
class Solution {
class TrieNode {
int count;
char value;
String word;
boolean isWord = false;
TrieNode[] children = new TrieNode[26];
TrieNode() {}
TrieNode(char value) {
this.value = value;
}
}
ArrayList<String>[] buckets = null;
public List<String> topKFrequent(String[] words, int k) {
TrieNode trieNode = new TrieNode( ' ');
buckets = new ArrayList[words.length];
List<String> res = new ArrayList<>();
for (int i = 0, len = words.length; i < len; ++i) {
insert(trieNode, words[i]);
}
dfs(trieNode);
for (int i = buckets.length - 1; i >= 0 && res.size() < k; --i) {
ArrayList<String> tempList = buckets[i];
if (tempList == null) continue;
for (int j = 0, lenJ = tempList.size(); j < lenJ && res.size() < k; ++j) {
res.add(tempList.get(j));
}
}
return res;
}
public void insert(TrieNode node, String word) {
char[] arrTemp = word.toCharArray();
for (int j = 0, lenJ = arrTemp.length; j < lenJ; ++j) {
if (node.children[arrTemp[j] - 'a'] == null)
node.children[arrTemp[j] - 'a'] = new TrieNode(arrTemp[j]);
node = node.children[arrTemp[j] - 'a'];
}
node.isWord = true;
node.count ++;
node.word = word;
}
public void dfs(TrieNode node) {
for (TrieNode tempNode : node.children) {
if (tempNode != null && tempNode.isWord) {
if (buckets[tempNode.count] == null) buckets[tempNode.count] = new ArrayList<>();
buckets[tempNode.count].add(tempNode.word);
}
if (tempNode != null) {
dfs(tempNode);
}
}
}
}
我们来看看结果:空间复杂度就是O(n)级别的,时间复杂度最高的就是每个单词的字母都遍历了一遍,我们假设每个单词的平均长度是m,时间复杂度就是O(n*m)。