692 前K个高频单词(哈希表)

1. 问题描述:

给一非空的单词列表,返回前 k 个出现次数最多的单词。返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。

示例 1:

输入: ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。注意,按字母顺序 "i" 在 "love" 之前。

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,出现次数依次为 4, 3, 2 和 1 次。

注意:

假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
输入的单词均由小写字母组成。
扩展练习:
尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/top-k-frequent-words

2. 思路分析:

分析题目可以知道我们可以使用一个哈希表来记录单词的出现次数,然后对哈希表按照双关键字排序,也即先按照字符串的出现次数排序,若字符串的出现次数相同那么按照字符串的字典序由小到大排序。除了这个思路之外,因为求解的是前k大的元素所以我们也可以使用堆维护前k大的元素但是会比较麻烦,下面使用的是直接对字典(python的字典可以表示哈希表)进行排序的方法。

3. 代码如下:

from typing import List
import collections


class Solution:
    def topKFrequent(self, words: List[str], k: int) -> List[str]:
        dic = collections.defaultdict(int)
        for w in words:
            dic[w] += 1
        # 对字典按照双关键字排序, 下面没有写items说明w是键, 字典排序之后返回的是键对应的列表
        dic = sorted(dic, key=lambda w: (-dic[w], w))
        return dic[:k]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值