python如何实现其他文本的统计_如何用Python实现任一个英文的纯文本文件,统计其中的单词出现的个数?...

import os

def count_words(inputname):

fh = open(inputname)

read_fh = fh.read()

number = 1

is_alpha = []

dict_words = {}

#清洗数据

for word in read_fh:

if word.isalpha():

is_alpha.append(word)

elif word == '\t' or word == '\n' or word == ' ':

is_alpha.append(word)

#将数据由List转成字符串

fh_alpha = ''.join(is_alpha)

fh_words = fh_alpha.split()

#将字符串中的单词转成小写

for words in fh_words:

words = words.lower()

#统计每个单词的出现次数,并记录到字典当中

if words not in dict_words:

dict_words[words] = number

else:

dict_words[words] = dict_words[words] + 1

#打印单词字典(每个单词的出现次数)

print dict_words

count_words("dict.txt")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值