统计文章单词出现次数

英文文章中的标点符号的处理,单词大小写的处理,再将单词通过字典的统计出现次数,最后用sorted()排序

#利用maketrans函数将标点符号映射为空格
table = str.maketrans(',.!"?:[]-',' ')
#打开需要统计的文件
f = open(r'C:\python\1.txt')
file1 = f.read()
f.close()
#根据maketrans的映射将文章中的内容进行处理,映射中的标点符号替换为空格,并且全部小写
f1 = file1.translate(table).lower()
#将文章中的单词分隔开来,存在数组之中
wordlist = f1.split(None)
#创建一个字典,统计每个单词出现的次数
d1 = {}
for word in wordlist:
d1[word] = d1.get(word,0) +1
#通过sorted函数排序,打印出前三
itemli =sorted(d1.items(), key=lambda x:x[1],reverse=True)
print (itemli[0:3])

执行结果如下:
[('the', 23), ('to', 13), ('of', 11)]

 

转载于:https://www.cnblogs.com/xiao-xue-di/p/10396163.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值