第 0004 题: 任一个英文的纯文本文件,统计其中的单词出现的个数
解答:先读取一个文件,再将文件拆分为单词,再统计单词的总个数,和每个单词出现的个数
#encoding:utf-8
import collections
# 获取文件中所有单词
def get_keywords(file):
word_list = []
content = open(file, "r")
for line in content:
word_list.extend(line.split())
return word_list
# 统计文章单词总个数
def count(file):
word_list = get_keywords(file)
return len(word_list)
# 统计每个单词出现的个数
def count_per_keyword(file):
word_list = get_keywords(file)
return collections.Counter(word_list)
if __name__ == '__main__':
file = 'C:\\Users\\ouyangxiaoqing\\Desktop\\test.txt'
print(count(file))
print(count_per_keyword(file))