欢迎点击「算法与编程之美」↑关注我们!
本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。
1 前言
近日,小编收到一粉丝的留言,想要知道如何用python统计文本中英文字母的出现次数及频率。所以特写此篇文章来为这个粉丝解答疑惑。
图1 粉丝留言
2 问题解决
这个问题可以分为两个部分,一是用python实现对文本文件的操作,二是python对字符串的计数操作。为了方便大家理解,小编将先说第二部分再说第一部分。
2.1用python统计给定字符串中的英文字母出现的次数及频率。
统计字符串中的英文字母出现次数的方法有很多种,小编就给大家介绍比较简单的一种,容易理解些。
“统计”。要统计一个字符的出现次数,在python中可以直接用count()函数,比如要统计的字符为i,字符串为text_file,其用法见代码。
count = text_file.count(i) #统计该字母在原文本中的出现次数
通过这行代码,已经可以实现统计想要的字符在字符串中的出现次数了,然后它出现的频率就直接可以用出现次数除以总字符数。接下来就要统计多个英文字母了。
“过滤”。要统计多个字母,就需要不停的执行第一步,所以就需要使用for循环,i就在目标字符串中遍历。因为只需要统计英文字母,所以也可以用python自带的判断函数isalpha()。还有为了在遍历的时候不重复统计出现过的字符,所以就需要对目标字符串做一个处理,用python的set()函数就可