import string
with open('walden.txt','r')as text:
words=text.read().split() #分词
list = [word.strip(string.punctuation).lower() for word in words] #去标点符号,大写字母统一成小写
words_set=set(list) #转换成集合,去除重复单词
words_dict = {keyword:list.count(keyword) for keyword in words_set} #创建字典,key为单词,value为单词出现的频率
res = sorted(words_dict.items(),key=lambda x:x[1],reverse=True) #根据words_dict中value的值对字典进行降序输出
print(res)
瓦尔登湖单词词频统计
最新推荐文章于 2020-11-19 11:42:41 发布