python英文词频统计-Python实现统计英文文章词频的方法分析

最新推荐文章于 2022-10-31 19:17:17 发布

weixin_39846612

最新推荐文章于 2022-10-31 19:17:17 发布

阅读量3.7k

点赞数 1

本文介绍了使用Python统计英文文章词频的详细步骤，包括读取文件、转换为单词列表、计算词频、排序并输出最高频的单词。示例代码展示了如何处理文本并输出前10个最频繁出现的单词。

摘要由CSDN通过智能技术生成

本文实例讲述了Python实现统计英文文章词频的方法。分享给大家供大家参考，具体如下：

应用介绍：

统计英文文章词频是很常见的需求，本文利用python实现。

思路分析：

1、把英文文章的每个单词放到列表里，并统计列表长度；

2、遍历列表，对每个单词出现的次数进行统计，并将结果存储在字典中；

3、利用步骤1中获得的列表长度，求出每个单词出现的频率，并将结果存储在频率字典中；

4、以字典键值对的“值”为标准，对字典进行排序，输出结果（也可利用切片输出频率最大或最小的特定几个，因为经过排序sorted()函数处理后，单词及其频率信息已经存储在元组中，所有元组再组成列表。）

代码实现：

fin = open("The_Magic_Skin _Honore_de_Balzac.txt") #the txt is up

#to you

lines=fin.readlines()

fin.close()

"""transform the article into word list

"""

def words_list():

chardigit="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789 "

all_lines = ""

for line in lines:

one_line=""

for ch in line:

if c

最低0.47元/天解锁文章

weixin_39846612

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
python英文词频统计-Python实现统计英文文章词频的方法分析

本文实例讲述了Python实现统计英文文章词频的方法。分享给大家供大家参考，具体如下：应用介绍：统计英文文章词频是很常见的需求，本文利用python实现。思路分析：1、把英文文章的每个单词放到列表里，并统计列表长度；2、遍历列表，对每个单词出现的次数进行统计，并将结果存储在字典中；3、利用步骤1中获得的列表长度，求出每个单词出现的频率，并将结果存储在频率字典中；4、以字典键值对的“值”为标准，对字...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。