import re with open('a.txt', 'r') as f: total = f.readlines() # 读取文本文件的每一行代码 s = {} # 用于储存单词以及单词的个数 for line in total: # 对每一行进行单词识别 a = re.findall(r'[^A-Z\'a-z$]+', line) # 具体参考re模块的使用 for i in a: line = line.replace(i, ' ') # 将其他字符以空格代替,例如标点符号 print(line) # 打印没有标点符号的文本文件的每一行 for word in line.split(): # 将单词存储于dict中 if word not in s: s[word] = 1 else: s[word] += 1 for k, v in s.items(): # 打印单词出现的个数 print(k, v)
任一个英文的纯文本文件,统计其中的单词出现的个数
最新推荐文章于 2021-08-02 21:20:07 发布