返回文件的行号,enumerate参数

如果要统计文件的行数,可以这样写:
count = len(open(filepath, 'r').readlines())
这种方法简单,但是可能比较慢,当文件比较大时甚至不能工作。

可以利用enumerate():
count = 0
for index, line in enumerate(open(filepath,'r')): 
   count += 1

enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。

可 添加 start 参数。

语法

以下是 enumerate() 方法的语法:

enumerate(sequence, [start=0])
  • sequence -- 一个序列、迭代器或其他支持迭代对象。
  • start -- 下标起始位置。

实战-----------------------------------------------------------------

我想返回敏感词所在的行号

f = open(path, 'rb')
for (num, value) in enumerate(f):
    num += 1

num就为行号,第几行

 

 

 

 

PS:精确查找敏感词

re.findall('([^a-zA-Z0-9_]|\s| )' + item['words_data'] + '([^a-zA-Z0-9_]|\s| )'

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值