可以下载一长篇的英文小说,进行词频的分析。
1.读入待分析的字符串
2.分解提取单词
3.计数字典
4.排除语法型词汇
5.排序
6.输出TOP(20)
7.对输出结果的简要说明。
fo=open('D:\\wgd.txt','r') s=fo.read() fo.close() for i in ',.?!': s=s.replace(i,' ') s=str.lower(s) b=s.split(' ') #单词的列表 d={} xiaochu={'','the','is','you','and','i'} #消除语法 keys=set(b)-xiaochu for i in keys: d[i]=b.count(i)#单词计数元祖的列表 a=list(d.items()) a.sort(key=lambda x:x[1],reverse=True)#排序 b.sort() for i in range(20): print(a[i])