可以下载一长篇的英文小说,进行词频的分析。
1.读入待分析的字符串
2.分解提取单词
3.计数字典
4.排除语法型词汇
5.排序
6.输出TOP(20)
7.对输出结果的简要说明。
fo=open('11.txt','r') s=fo.read() fo.close() s =s.lower() for i in ',!?': s=s.replace(i,' ') b=s.split(' ') qc={'','—','to','is', 'and','on','for','the','as','or','has','of','are','from','-' ,'say'} dic={} key=set(b)-qc for w in key: dic[w]=b.count(w) wcl=list(dic.items()) wcl.sort(key=lambda x:x[1],reverse=True) for i in range(20): print(wcl[i])
这是一篇关于月亮制造者的励志小说