Walden单词词频统计

原版

import collections #创建一个新的容器
f = open('D:/Walden.txt', 'r').read() #打开本地文本文件,r表示以读取方式打开
f=f.replace(',','').replace('.','').replace('"','').replace(':','') #将所有标点替换成空格
f = f.split() #取出所有单词
f = collections.Counter(f) #在容器中统计每个单词的出现词频
print(f)

改良版

#打开并读取函数
file=open(r'D:\Walden.txt', 'r')
lines=file.readlines()
lines
words=[]

for line in lines:
    tmp_list=line.split(" ")#print((line.split(""))
    for word in tmp_list:
        words.append(word)#words.append(tmp_list)
#对word中每个元素计算他出现的个数
#把统计结果保存到字典中,字典的key是单词,value是单词出现的次数
word_count={}
word_set=set(words)
for word in word_set:
    count_nun=words.count(word)
    word_count[word]=count_num
#对word_count字典进行排序,按照出现的次数(value)进行降序排序
sorted(word_count.items(),key=lambda item:item[1],reverse=True)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值