统计单词出现次数
需求:任一个英文的纯文本文件,统计其中的单词出现的个数
分析:需要操作文本文档,那肯定需要操作路径,因此必须加载os库,另外还需测试从文档读出内容是否为字符串isalpha()方法等。
源代码:
import os os.chdir('c:/workspace') #初始化变量和打开文档 def count_words(inputname): fh = open(inputname) read_fh = fh.read() number = 1 is_alpha = [] dict_words = {} for word in read_fh: if word.isalpha(): is_alpha.append(word) elif word =='\t' or word == '\n' or word == ' ': is_alpha.append(word) #join连接后存入fh_alpha中的数据类型为str fh_alpha = ''.join(is_alpha) fh_words = fh_alpha.split() for words in fh_words: words = words.lower() #判断列表项中的值在字典中有没有 if words not in dict_words: #没有时words的内容自动作为key,number中的值传递给字典作为values dict_words[words] = number else: dict_words[words] = dict_words[words]+1 print(dict_words) count_words("log.txt")