1、题目:前K个高频单词
给一非空的单词列表,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。
2、解题思路
先用哈希表统计单词的出现频率,然后因为题目要求前 K 大。所以构建一个 大小为 K 的小根堆按照上述规则自定义排序的比较器。然后依次将单词加入堆中,当堆中的单词个数超过 K 个后,我们需要弹出顶部最小的元素使得堆中始终保留 K 个元素,遍历完成后剩余的 K 个元素就是前 K 大的。最后我们依次弹出堆中的 K 个元素加入到所求的结果集合中。
注意:因为构建的是小根堆,所以从顶部弹出的元素顺序是从小到大的,所以最后我们还需要反转集和。
3、代码
class Solution
{
public:
vector<string> topKFrequent(vector<string>& words, int k)
{
unordered_map<string, int> cnt;
//用于哈希表统计各单词个数
for (auto& word : words)
{
cnt[word]++;
}
//用于设置排序顺序
auto cmp = [](const pair<string, int>& a, const pair<string, int>& b)
{
return a.second == b.second ? a.first < b.first : a.second > b.second;
};
priority_queue<pair<string, int>, vector<pair<string, int>>, decltype(cmp)> que(cmp);
for (auto& it : cnt)
{
que.emplace(it);
if (que.size() > k)
{
que.pop();
}
}
vector<string> ret(k);
for (int i = k - 1; i >= 0; i--)
{
ret[i] = que.top().first;
que.pop();
}
return ret;
}
};