前K个高频单词

最新推荐文章于 2021-05-21 21:50:30 发布

辰星~

最新推荐文章于 2021-05-21 21:50:30 发布

阅读量259

点赞数

分类专栏：每日一题

本文链接：https://blog.csdn.net/weixin_45295598/article/details/106946181

版权

每日一题专栏收录该内容

56 篇文章 0 订阅

订阅专栏

给一非空的单词列表，返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率，按字母顺序排序。

示例 1：

输入: [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”]
解析: “i” 和 “love” 为出现次数最多的两个单词，均为2次。
注意，按字母顺序 “i” 在 “love” 之前。

示例 2：

输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”, “is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词，
出现次数依次为 4, 3, 2 和 1 次。

注意：

假定 k 总为有效值， 1 ≤ k ≤ 集合元素数。
输入的单词均由小写字母组成。

扩展练习：

尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。

来源：力扣（LeetCode）
链接：https://leetcode-cn.com/problems/top-k-frequent-words
著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。

//思路：用关联式容器统计单词出现的次数，并按照出现次数排序
class Solution {
public:
 vector<string> topKFrequent(vector<string>& words, int k)
 {
 // 用<单词，单词出现次数>构建键值对，然后将vector中的单词放进去，统计每个单词出现的次数
 map<string, int> m;
 for (size_t i = 0; i < words.size(); ++i)
 ++(m[words[i]]);
 // 将单词按照其出现次数进行排序
 vector<pair<string,int>> v(m.begin(),m.end());
 //这里使用了lambda表达式[](){}
 std::sort(v.begin(),v.end(),[](const pair<string, int>& left, const pair<string, int>& right){
     return left.second > right.second;
 });
 // 将相同次数的单词放在set中，然后再放到vector中
 set<string> s;
 size_t count = 0; // 统计相同次数单词的个数
 size_t leftCount = k;      控制还需要插入的前k个高频单词的次数
 
 vector<string> ret;
 for (auto& e: v)
 {
 if (!s.empty())
 {
 // 相同次数的单词已经全部放到set中
 if (count != e.second)
 {
 if (s.size() < leftCount)
 {
 ret.insert(ret.end(), s.begin(), s.end());
 leftCount -= s.size();
 s.clear();
 }
 else
 {
 //若出现次数相同的单词的数量大于leftcount则跳出，只增加前leftcount个
 break;
 }
 }
 }
 count = e.second;
 s.insert(e.first);
 }
 //处理跳出循环的情况
 for (auto& e : s)
 {
 if (0 == leftCount)
 break;
 ret.push_back(e);
 leftCount--;
 }
 return ret;
 }
 };