python 文件内容操作,如一个文件100万条数据,查询相同行数
mip版 关注:213 答案:5 悬赏:60
解决时间 2021-02-24 09:52
已解决
2021-02-23 20:21
其中一条记录是1,2,3,5,6,7,49,5,6 ,我有固定字符串是,1,2,3 请如何得到1,2,3,在文件里存在所有条数
最佳答案
2021-02-23 20:41
使用open函数逐行读取文件,依次对比,如包含要求字符串,则数量累加1,读取完成后可统计出行数,代码如下:
n = 0
for line in open('filename','r'):
if '固定字符串' in line:
n += 1
print(n)说明:
使用 for line in open这种方式可以提高代码效率,如需要更复杂统计,例如重复行,则可以使用hash函数,把行hash值存入列表,再做统计。
全部回答
1楼
2021-02-23 23:41
python默认库不能随机读写文件。只能一次读入和写入。以下是示例代码。
filename='setup.ini'
lines=[]
with open(filename,'r',encoding='utf8') as f:
lines=f.readlines()
lines[167]='upi1=chinese'
lines[231]='upi1=chinese'
with open(filename,'w',encoding='utf8') as f:
f.write('\n'.join(lines))
f.flush()修改需谨慎,修改前请记得备份,不明白可追问。
2楼
2021-02-23 23:29
100万条,还是不是很大。建议用C语言。把100万条加载到内存里,然后字符串依次比较,也是很快的。具体是先read到内存里,然后把每个回车统计一下,建立一个行首字符的索引。
正常的做法是做索引的。在生成记录时,自动将关键词索引造出来。查询时,只查询索引就可以了。
这样,即使是几千万条记录,查询也是很快。1,2,3就是一个关键词。
3楼
2021-02-23 22:40
CONDSTR = '1,2,3'
def match(ln, condstr=CONDSTR):
''' 指定的串是否在行中 '''
return condstr in ln
cnt = 0
with open(thesrcfile, 'rt') as handle:
for ln in handle:
if match(ln):
cnt += 1
4楼
2021-02-23 21:09
我总感觉你这标题和内部描述不是一个问题,
不知道理解的对不对,执行如下代码(python2.X)
foid=open('文件名',‘r’) #打开你的文件;
fov=open('结果',‘w’) #考虑到结果可能比较多,写入文件比较好;
n=0
for line in foid:
if not line.find('1,2,3')==-1: #用find查找这一行中是否有目标字符串;
n=n+1 #如果有该字符串,计数
fov.write(line) #保存有这个字符串的那一行数据,如果结果不多可以直接print line
foid.close()
fov.close()
print n
这样就找出所以包含'1,2,3'这个字符串的数据了,n是含有这个字符串的行数,如果在循环内部执行print n,可以得到这个字符串都在第几行出现过
我要举报
如果感觉以上信息为低俗/不良/侵权的信息,可以点下面链接进行举报,我们会做出相应处理,感谢你的支持!
点此我要举报以上信息!
推荐资讯
大家都在看