(
如果要统计文件的行数,可以这样写:
count = len(open(filepath, 'r').readlines())
这种方法简单,但是可能比较慢,当文件比较大时甚至不能工作。
可以利用enumerate():
count = 0
for index, line in enumerate(open(filepath,'r')):
count += 1
)
enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
可 添加 start 参数。
语法
以下是 enumerate() 方法的语法:
enumerate(sequence, [start=0])
- sequence -- 一个序列、迭代器或其他支持迭代对象。
- start -- 下标起始位置。
实战-----------------------------------------------------------------
我想返回敏感词所在的行号
f = open(path, 'rb') for (num, value) in enumerate(f): num += 1
num就为行号,第几行
PS:精确查找敏感词
re.findall('([^a-zA-Z0-9_]|\s| )' + item['words_data'] + '([^a-zA-Z0-9_]|\s| )'