LeetCode 每日一题 692. 前K个高频单词

692. 前K个高频单词

给一非空的单词列表,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。

示例 1:

输入: ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i""love" 为出现次数最多的两个单词,均为2次。
    注意,按字母顺序 "i""love" 之前。

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny""day" 是出现次数最多的四个单词,
    出现次数依次为 4, 3, 21 次。

注意:

  • 假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
  • 输入的单词均由小写字母组成。

扩展练习:

  1. 尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。

方法一:哈希表 + 优先队列

解题思路

目的是求 词频,可以用哈希表先统计出每个单词的频率。统计完成后可以根据词频大小直接对哈希表进行排序操作在取前 k 个即可,但这样的时间复杂度为 O(n * logn)。

事实上只需要取前 k 个就行,这是典型的 Top K 问题。使用优先队列维护前 k 个单词,根据题意,排序规则分两种情况:

  1. 词频相同,字典序高的在前面
  2. 词频不同,词频小的在前面

最后将优先队列里的 k 个元素放入 List 即可。(注意:优先队列是个小顶堆,最后需要反转列表。)

参考代码

 public List<String> topKFrequent(String[] words, int k) {
 	// 哈希表统计词频
    Map<String, Integer> counts = new HashMap<>();
    for (String word : words) {
        counts.put(word, counts.getOrDefault(word, 0) + 1);
    }
    // 优先队列维护前 k 个
    PriorityQueue<String> queue = new PriorityQueue<>((s1, s2) ->
            counts.get(s1).equals(counts.get(s2)) ? s2.compareTo(s1) : counts.get(s1) - counts.get(s2));
    for (Map.Entry<String, Integer> entry : counts.entrySet()) {
        queue.offer(entry.getKey());
        if (queue.size() > k) {
            queue.poll();
        }
    }
    // 计算结果
    List<String> ans = new ArrayList<>();
    while (!queue.isEmpty()) {
        ans.add(queue.poll());
    }
    Collections.reverse(ans);
    return ans;
}

执行结果
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值