Python 英文文件统计词频进阶版

def getText(file):
    with open(file, 'r', encoding='UTF-8') as txt: #打开文件
        txt = txt.readlines()#,以readlines模式,每个字符为一个行“伪字符串”
        for line in txt:
            for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~\n':
                line = line.replace(ch, ' ')#置换特殊字符
            line = line.lower() #统一成小写
    return txt

for i in range(10):
    try:#试错,防止异常退出
        file = input("请输入文件名(不带后缀):")+'.txt'#输入文件名
        TEXT = getText(file)#进行前处理
        d = {}#建立空字典
        for strs in TEXT:#此时strs为每行的长字符串
            words = strs.split()#将长字符串分割,split后为列表
            for word in words:#遍历列表,进行计数
                d[word] = d.get(word, 0) + 1#get函数,如果存在,就+1,不存在就设为1.
        item = list(d.items())#转为字典,方便排序
        item.sort(key= 
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值