python字频统计_python怎么统计文本中的字频

最新推荐文章于 2023-02-20 11:21:37 发布

weixin_39575054

最新推荐文章于 2023-02-20 11:21:37 发布

阅读量779

点赞数

文章标签： python字频统计

本文介绍了如何使用Python对文本进行字频统计，通过读取文件、排除标点符号、利用字典累加字频，最后对结果进行排序，以芳华小说为例展示了具体代码和部分输出结果。

摘要由CSDN通过智能技术生成

当我们在看一篇文章甚至是一本小说的时候，想知道文本中哪个字出现的最多，出现了多少次，该怎么办？Python可以用简单的代码就可以实现这份工作。你也可以拓展一下，可以通过小说中谁的名字或者哪一句话出现的次数最多来推断主角是谁？口头禅是什么？是不是十分有趣，快来试试吧。

思路：

是先把每个字符提出来放在列表里；

再过滤掉其中的标点符号；

最后用字典对某个字出现的频率进行累加。

下面以芳华这本小说为例：#coding:utf-8

word_lst = []

word_dict = {}

exclude_str = "，。！？、()【】<>《》=：+-*—“”…"

with open("芳华.txt","r") as fileIn ,open("芳华字频.txt",'w') as fileOut:

# 添加每一个字到列表中

for line in fileIn:

for char in line:

word_lst.append(char)

# 用字典统计每个字出现的个数

for char in word_lst:

if char not in exclude_str:

if char.strip() not in word_dict: # strip去除各种空白

word_dict[char] = 1

else :

最低0.47元/天解锁文章

weixin_39575054

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python字频统计_python怎么统计文本中的字频

当我们在看一篇文章甚至是一本小说的时候，想知道文本中哪个字出现的最多，出现了多少次，该怎么办？Python可以用简单的代码就可以实现这份工作。你也可以拓展一下，可以通过小说中谁的名字或者哪一句话出现的次数最多来推断主角是谁？口头禅是什么？是不是十分有趣，快来试试吧。思路：是先把每个字符提出来放在列表里；再过滤掉其中的标点符号；最后用字典对某个字出现的频率进行累加。下面以芳华这本小说为例：#codi...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。