python3统计字符串在文本中出现的次数(支持同时多个字符串)

前言

学校老师要求统计人物在小说中出现的次数,我从网上找了一下脚本,并附上注释。

代码

import sys
import re

print()
# 此处的“\033[33m”是python的颜色特效控制,具体使用方法看下文的相关链接
# 输入要统计的文本位置
obj_file = input("\033[33m请输入文件路径及文件名:\033[35m");"\033[0m"
print()
# 输入要匹配的字符
obj_str = input("\033[33m请输入要查找的字符或字符串,多个以空格分隔:\033[35m");"\033[0m"
print()
# 读文本
file_obj = open('%s' % obj_file, 'r').read()
# 此处把你输入想要进行匹配的字符串做处理,例如,你输入:a b,会转换成a|b,对应正则表达式中的匹配a或b,具体方法使用看下面的相关链接。
str_re = "|".join(re.sub(' +', ' ', obj_str).split(" "))
# %s,表示格式化一个对象为字符;str_re为正则表达式,file_obj是要处理的文本
all_str = re.finditer(r'%s' % str_re, file_obj)
count_dict = {}
for s in all_str:
# s.group()方法用于从s中返回相应的字符串;setdefault()方法用于更新count_dict字典中对应key的vuale,返回值为数字
    count_dict[s.group()] = count_dict.setdefault(s.group(), 0) + 1
# items用于可遍历的(键, 值) 元组数组;k[0]表示按key值,k[1]表示按value值排序,reverse为True表示倒序,False表示正序,key=lambda k: k[1]让列表按照第二维度排序
count_dict = sorted(count_dict.items(), key=lambda k: k[1], reverse=True)
for c in count_dict:
    print("\033[32m【 %s 】 出现的次数为 : %d\033[0m" % (c[0], c[1]))

print()

相关链接

  1. Python中颜色控制
  2. Python 正则表达式
  3. Python re.sub的使用方法
  4. Python split()方法
  5. Python3 join()方法
  6. PYTHON 中的" %S"%用法
  7. Python3 格式化输出 %s & %d 等
  8. re.findall() re.finditer()的用法
  9. Python3 正则表达式的一些函数(包括group()方法)
  10. Python 字典(Dictionary) setdefault()方法
  11. Python 字典(Dictionary) items()方法
  12. python3 sorted(t, key=lambda x:x[0])排序问题
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值