哈姆雷特英文
三国演义中文
哈姆雷特英文词频分析
def getText():
txt=open("hamlet.txt","r").read()#打开文本,输入具体的文本路径
txt=txt.lower()#将文本中所有的英文字符变成小写
for ch in '!"#$%&()*+,-./;:<=>?@[\\]^‘_{|}~':
txt=txt.replace(ch," ")
return txt #去掉特殊符号
hamletTxt=getText()#调用函数对文本进行处理
words=hamletTxt.split()#进行列表
counts={}#字典
for word in words:
counts[word]=counts.get(word,0)+1#获取到的词在字典中寻找如果有的话在原来的基础上+1,如果没有就收录到字典中
items=list(counts.items())#变成列表类型
items.sort(key=lambda x:x[1],reverse=True)#对列表排序
for i in range(10):#将出现次数前10的单词输出并输出出现次数
word,count=items[i]
print("{0:<10}{1:>5}".format(word,count))