统计文章单词出现次数

最新推荐文章于 2022-07-31 21:30:00 发布

weixin_30338481

最新推荐文章于 2022-07-31 21:30:00 发布

阅读量469

点赞数

文章标签：数据库 python

原文链接：http://www.cnblogs.com/xiao-xue-di/p/10396163.html

版权

英文文章中的标点符号的处理，单词大小写的处理，再将单词通过字典的统计出现次数，最后用sorted()排序

#利用maketrans函数将标点符号映射为空格
table = str.maketrans(',.!"?:[]-',' ')
#打开需要统计的文件
f = open(r'C:\python\1.txt')
file1 = f.read()
f.close()
#根据maketrans的映射将文章中的内容进行处理，映射中的标点符号替换为空格，并且全部小写
f1 = file1.translate(table).lower()
#将文章中的单词分隔开来，存在数组之中
wordlist = f1.split(None)
#创建一个字典,统计每个单词出现的次数
d1 = {}
for word in wordlist:
d1[word] = d1.get(word,0) +1
#通过sorted函数排序，打印出前三
itemli =sorted(d1.items(), key=lambda x:x[1],reverse=True)
print (itemli[0:3])

执行结果如下：
[('the', 23), ('to', 13), ('of', 11)]

转载于:https://www.cnblogs.com/xiao-xue-di/p/10396163.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30338481

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
统计文章单词出现次数

英文文章中的标点符号的处理，单词大小写的处理，再将单词通过字典的统计出现次数，最后用sorted()排序#利用maketrans函数将标点符号映射为空格table = str.maketrans(',.!"?:[]-',' ')#打开需要统计的文件f = open(r'C:\python\1.txt')file1 = f.read()f.close()#根据make...
复制链接

扫一扫