2024-1-4,卡码网第16题出现频率最高的字
目录
1. 题目描述
题目给定一组只包含小写字母的字符串,统计字符串中出现频率最高的字母,并输出该字母,如果有多个出现频率相同的字符串,则输出顺序靠前的那个。
2. 代码实现
2.1 解题思路
这道题,将具体例子剥除,就可以抽象为在一串数据中,统计各个数据出现的频率。如果是人自己统计的话,想必大家都会将在草稿纸上写好每类数据和对应的出现频率。那么,对于编程实现来说也一样。不过,显然是不能够使用上三篇博客中使用的链表,因为链表是一种有序性数据类型,访问其中的一个节点必须要知道它的上一个节点,这对于统计频率来说,构建链表显然是增加了接替的复杂度。那么,对于需要每种数据需要统计两个要素时,应该使用一种全新的数据类型——哈希表。
2.1.1 哈希表
什么是哈希表?哈希表,就是一种存放着一对一对键值对的数据容器。那么,什么又是键值对?通俗的讲,就是给你一串钥匙,钥匙上面有数字编号,然后在你的面前有一排柜子,柜子上的编号和钥匙上的编号一一对应,用钥匙打开柜子,就能拿到存放在里面的东西。钥匙,即 key ;柜子,就是 value。这就是键值对,当你需要访问某个值时,只需要知道它的 key 就可以查询了。在python中,什么样的数据类型具有键值对这种特点?首当其冲,就是字典。构建一个字典,注意是大括号{},冒号前面的是 key,后面是 value。
my_dict = {'name': 'John', 'age': 25, 'city': 'New York'}
print(my_dict['name']) # 输出: John
2.2.2 解题过程
列表,是一种简单的哈希表,严格意义上来说,并不是,但列表的下标和值很像一种键值对。
my_list = [1, 2, 3, 'apple', 'orange']
print(my_list[3]) # 输出: apple
对于这道题,不仅需要统计字母出现的频率,还要知道是哪个字母频率最高。两个要素,很像键值对,那么就把索引 key 代表字母,值 value 代表出现频率,然后通过遍历一遍字符串(data),创建一个列表(temp)统计好每个字母出现的频率。这时候,虽然我们已经知道了每个字母的出现频率,但是我们并不知道频率最大的是哪个字母,所以需要再遍历一遍列表(temp)。代码如下,其中 ord 就是输出字符所对应的 Unicode码,对于只包含小写字母的字符串,每一个字符与小写 a 的Unicode码相减就是该字母的索引,通过这个索引,更新频率。最后,找到最大的频率数,输出对应的字母,直接通过 chr() 函数将(索引 + a的Unicode)转化即为出现次数最多的那个字母。
data = list(input())
max = 0
maxfreq = -1
temp = [0]*26
for char in data:
loc = int(ord(char) - ord('a'))
temp[loc] += 1
for i in range(26):
if temp[i] > max:
max = temp[i]
maxfreq = i
3. 总结
这道题,介绍了一种新的数据类型,哈希表。通过键找对应的值,不需要像链表一样,查询某个节点就需要知道该节点前的所有节点。当然,这道题并非真正运用了哈希表,而是思路较为类似的列表,但是题目较为典型,是很好的一道题。
本人所用代码编辑器为 VS Code,刷题网站为卡码网