Python按行读文件

Python按行读文件
1. 最基本的读文件方法readline()

fp = open("file.txt","r")
while 1:
    line = fp.readline()
    if not line:
        break
    pass # do something
一行一行得从文件读数据,速度比较慢,但是省内存。如果文件比较大的时候,由于内存有限,缓存整个个文件内容可能出错,可以考虑逐行读取处理;

2. 一次读取文件固定大小

file = open("file.txt","r")
while 1:
    lines = file.readlines(100000)
    if not lines:
        break
    for line in lines:
        pass # do something
fp.close()
fp.readline([size]) #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。

3. 一次读取文件所有内容

 file = open("file.txt","r")
 lines = fp.readlines()
 fp.close()
 for line in lines:
     pass #do somgthing
 
4.使用linecache

在python中,有个好用的模块linecache,该模块允许从任何文件里得到任何的行,并且使用缓存进行优化。读取大文件的时候,建议使用此模块读取
cache=linecache.getlines('file.txt')[0:4]
for line in cache:
    pass # do something
linecache.clearcache()

lines=linecache.getlines('file.txt')[0:5] #获取文件中第1-5行的内容
line =linecache.getline('file.txt',5)     #获取文件中第5行的内容

linecache.getlines(filename) #从名为filename的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,并以linenum-1为元素在列表中的位置存储
在使用linecache.getlines('file.txt')打开文件的内容之后,如file.txt文件发生了改变,如果要再次用linecache.getlines获取的内容,不是文件的最新内容,还是之前的内容,此时有两种方法:
(1)使用linecache.checkcache(filename)来更新文件在硬盘上的缓存,然后在执行linecache.getlines('file.txt')就可以获取到a.txt的最新内容;
(2)直接使用linecache.updatecache('file.txt'),即可获取最新的文件内容
另外:
(1)读取文件之后,不需要使用文件的缓存时,需要在最后清理一下缓存,使linecache.clearcache()清理缓存,释放缓存。
(2)此模块使用内存来缓存文件内容,所以需要耗费内存,打开文件的大小和打开速度和你的内存大小有关系。

5、 文件其他相关操作

fp.close() 
#关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。如果一个文件在关闭后还对其进行操作会产生ValueError 
fp.flush() 
#把缓冲区的内容写入硬盘 
fp.fileno() 
#返回一个长整型的”文件标签“ 
fp.isatty() 
#文件是否是一个终端设备文件(unix系统中的) 
fp.read([size]) 
#size为读取的长度,以byte为单位 
fp.readline([size])  
#读一行,如果定义了size,有可能返回的只是一行的一部分 
fp.tell() 
#返回文件操作标记的当前位置,以文件的开头为原点 
fp.next() 
#返回下一行,并将文件操作标记位移到下一行。把一个file用于for ... in file这样的语句时,就是调用next()函数来实现遍历的。 
fp.seek(offset[,whence]) 
#将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。 
fp.truncate([size]) 
#把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值