python 实现文章中词汇的频率统计并进行显示(针对英文文章)

最新推荐文章于 2023-10-26 21:55:53 发布

哈哈哈哈士奇VIP

最新推荐文章于 2023-10-26 21:55:53 发布

阅读量8.7k

点赞数 5

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiaowosiye/article/details/79209422

版权

本文介绍了如何使用Python实现英文文章中单词的频率统计。通过处理文件中的每一行，替换分隔符，利用字典存储单词及其频次，并对频次进行排序，展示出现频次最高的单词。

摘要由CSDN通过智能技术生成

python实现英文文章中出现单词频率的统计

本文的思路：

首先打开文件，对于文件的每一行进行词汇的统计，在这里需要注意需要替换每一行中的单词之间的分隔符为空格，然后使用split()函数去掉空格，这样每一行剩下的就是纯粹的单词，然后遍历每一行中的每一个单词，将已经出现在字典中的单词，频次直接+1就行(这里需要用到字典中根据键来查找值的操作:dictionaryName[key]+=1)

由于很多时候我们只需显示出现频次最多的前多少条所以这里需要对频次进行排序，经过上一个步骤我们已经吧单词以及对应的频次存储在字典中，接下来使用items()函数和list(dictionaryName.items()）把字典中的键值对构成列表，这一步之后可以转化为[(key1,value1),(key2,value2)….] ,这样就可以通过访问二位列表中元素的方法进行访问每个单词以及出现的频次了

代码

最低0.47元/天解锁文章

哈哈哈哈士奇VIP

关注

5
点赞
踩
40

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。