任一个英文的纯文本文件，统计其中的每个单词出现的个数，注意是每个单词

最新推荐文章于 2020-07-02 09:43:22 发布

qq_32696559

最新推荐文章于 2020-07-02 09:43:22 发布

阅读量817

点赞数 3

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_32696559/article/details/105633241

版权

笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

# -*- coding: utf-8 -*-
import codecs

file = open('doc.txt','r',encoding='utf-8')
dict = {}
for line in file:
		h_line = line.split()
		#以空格分割列表
		for key in h_line:
				#循环每行列表的字符串
				#如果字符串是以字母结尾时
				if (key[-1]>='a' and key[-1] <='z') or (key[-1]>='A' and key[-1] <= 'Z'):
							key = key.lower()
				else:
						#不以字母结尾是切片把后面字符去掉
						key = key.lower()[0:-1]
				if key not in dict:#如果当前字符串不在dic
						dict[key] = 1
				else:
						dict[key] += 1
print(dict)

#统计单纯个数
count = 0
for v in dict.values():
		count += v
print('一共{}个单词'.format(count))