给一非空的单词列表,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。
示例 1:
输入: [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”]
解析: “i” 和 “love” 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 “i” 在 “love” 之前。
示例 2:
输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”, “is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。
注意:
假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
输入的单词均由小写字母组成。
扩展练习:
尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/top-k-frequent-words
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
//思路:用关联式容器统计单词出现的次数,并按照出现次数排序
class Solution {
public:
vector<string> topKFrequent(vector<string>& words, int k)
{
// 用<单词,单词出现次数>构建键值对,然后将vector中的单词放进去,统计每个单词出现的次数
map<string, int> m;
for (size_t i = 0; i < words.size(); ++i)
++(m[words[i]]);
// 将单词按照其出现次数进行排序
vector<pair<string,int>> v(m.begin(),m.end());
//这里使用了lambda表达式[](){}
std::sort(v.begin(),v.end(),[](const pair<string, int>& left, const pair<string, int>& right){
return left.second > right.second;
});
// 将相同次数的单词放在set中,然后再放到vector中
set<string> s;
size_t count = 0; // 统计相同次数单词的个数
size_t leftCount = k; 控制还需要插入的前k个高频单词的次数
vector<string> ret;
for (auto& e: v)
{
if (!s.empty())
{
// 相同次数的单词已经全部放到set中
if (count != e.second)
{
if (s.size() < leftCount)
{
ret.insert(ret.end(), s.begin(), s.end());
leftCount -= s.size();
s.clear();
}
else
{
//若出现次数相同的单词的数量大于leftcount则跳出,只增加前leftcount个
break;
}
}
}
count = e.second;
s.insert(e.first);
}
//处理跳出循环的情况
for (auto& e : s)
{
if (0 == leftCount)
break;
ret.push_back(e);
leftCount--;
}
return ret;
}
};