瓦尔登湖单词词频统计

最新推荐文章于 2020-11-19 11:42:41 发布

Elixnagnip.

最新推荐文章于 2020-11-19 11:42:41 发布

阅读量428

点赞数

文章标签： python

本文链接：https://blog.csdn.net/crush506/article/details/109782010

版权

import string
with open('walden.txt','r')as text:
    words=text.read().split() #分词
    list = [word.strip(string.punctuation).lower() for word in words] #去标点符号，大写字母统一成小写
    words_set=set(list) #转换成集合，去除重复单词
    words_dict = {keyword:list.count(keyword) for keyword in words_set} #创建字典，key为单词，value为单词出现的频率
res = sorted(words_dict.items(),key=lambda x:x[1],reverse=True) #根据words_dict中value的值对字典进行降序输出
print(res)