任一个英文的纯文本文件,统计其中的每个单词出现的个数,注意是每个单词

# -*- coding: utf-8 -*-
import codecs

file = open('doc.txt','r',encoding='utf-8')
dict = {}
for line in file:
		h_line = line.split()
		#以空格分割列表
		for key in h_line:
				#循环每行列表的字符串
				#如果字符串是以字母结尾时
				if (key[-1]>='a' and key[-1] <='z') or (key[-1]>='A' and key[-1] <= 'Z'):
							key = key.lower()
				else:
						#不以字母结尾是切片把后面字符去掉
						key = key.lower()[0:-1]
				if key not in dict:#如果当前字符串不在dic
						dict[key] = 1
				else:
						dict[key] += 1
print(dict)

#统计单纯个数
count = 0
for v in dict.values():
		count += v
print('一共{}个单词'.format(count))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值