所谓迭代,是指不断重复某个动作,直到这些动作都完成
按字节处理
在while循环中,read方法是最常见的对文件迭代的方法
#! /usr/bin/evn python
#-*- coding:utf-8 -*-
path='./test.txt'
f_name=open(path,'w')
print('write lenght:',f_name.write('Hello'))
f_name=open(path)
c_str=f_name.read(1)
while c_str:
print('read c_str is:',c_str)
c_str=f_name.read(1)
f_name.close()
执行结果:
write lenght: 5
read c_str is: H
read c_str is: e
read c_str is: l
read c_str is: l
read c_str is: o
可以看到,该操作对文件中的每个字符都进行循环。这个程序运行到文件尾部时,read方法会返回一个空字符。
#优化代码
f_name=open(path)
while True:
c_str=f_name.read(1)
if not c_str:
break
print('read c_str is:',c_str)
f_name.close()
按行操做
在实际操作中,处理文件时可能需要对文件的行进行迭代,而不是单个字符。
使用readline方法按行读取字符:
#! /usr/bin/evn python
#-*- coding:utf-8 -*-
path='./test.txt'
f_name=open(path)
while True:
line=f_name.readline(1)
if not line:
break
print('read line is:',line)
f_name.close()
使用fileinput实现懒加载模式
使用read和readlines方法不带参数时将加载文件中所有内容,然后加载到内存中。
当文件很大时,这种方法会占用太多的内存,甚至直接内存溢出,从而导致失败。这种情况下,我们可以考虑使用while和readline方法代替这些方法。
按行读取文件时,若能使用for循环,则称之为懒加载式迭代,因为在操作过程中只读取实际需要的部分。
使用fileinput需要导入该模块:
#! /usr/bin/evn python
#-*- coding:utf-8 -*-
import fileinput
path='g:/test.txt'
for ine in fileinput.input(path):
print('line is:',ine)
文件迭代器
从Python2.2开始,文件对象是可迭代的,这意味着可以直接在for循环中使用文件对象,从而进行迭代:
#! /usr/bin/evn python
#-*- coding:utf-8 -*-
path='g:/test.txt'
f_name=open(path)
for line in f_name:
print('line is:',line)
f_name.close() #迭代结束后要显式关闭文件
❤️