任一个英文的纯文本文件，统计其中的单词出现的个数

最新推荐文章于 2021-08-02 21:20:07 发布

minhoag

最新推荐文章于 2021-08-02 21:20:07 发布

阅读量1k

点赞数

文章标签： python 正则表达式

原文链接：https://blog.csdn.net/junli_chen/article/details/49079523

版权

import re


with open('a.txt', 'r') as f:
    total = f.readlines()  # 读取文本文件的每一行代码
s = {}  # 用于储存单词以及单词的个数
for line in total:  # 对每一行进行单词识别
    a = re.findall(r'[^A-Z\'a-z$]+', line)  # 具体参考re模块的使用
    for i in a:
        line = line.replace(i, ' ')  # 将其他字符以空格代替，例如标点符号
    print(line)  # 打印没有标点符号的文本文件的每一行
    for word in line.split():  # 将单词存储于dict中
        if word not in s:
            s[word] = 1
        else:
            s[word] += 1


for k, v in s.items():  # 打印单词出现的个数
    print(k, v)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

minhoag

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
任一个英文的纯文本文件，统计其中的单词出现的个数

import rewith open('a.txt', 'r') as f: total = f.readlines() # 读取文本文件的每一行代码s = {} # 用于储存单词以及单词的个数for line in total: # 对每一行进行单词识别 a = re.findall(r'[^A-Z\'a-z$]+', line) # 具体参考re模块的使用 for i in a: line = line.replace(i, ' ') # 将.
复制链接

扫一扫