Python 读取大文件

最近在用python处理日志分析数据,但是有些文件比较大,几个G,如果用linecache 或 都直接open整个文件,readlines 都容易导致占用过多内存,

导致程序停止执行。


Google了一下,python读取大文件的方法有以下几种:

个人推荐第一种,实测程序跑得刚刚的。

一、 用with 读取大文件

with读取是非常Pythonic的方法,示例如下:

with open(filepath) as f:
    for line in f:
        <do something with line>

这个方法是在Stackoverflow上找到,这位高手对with读取的解释是这样的:

The with statement handles opening and closing the file, including if an exception is raised in the inner block. The for line in f treats the file object f as an iterable, which automatically uses buffered IO and memory management so you don't have to worry about large files.

大意就是with负责处理open和close文件,包括抛出内部异常。而for line in f将文件对象f当做迭代对象,将自动处理IO缓冲和内存管理,这样你无需担心大文件的处理了。

二、使用fileinput 模块

示例代码如下:

import fileinput
for line in fileinput.input(['sum.log']):
    print line

第一种更Pythonic,也无需import,而且还能处理close和Exception,所以更推荐使用。


在文件处理时,读取整行,每行后会有一个换行符。python 其实也提供了一个方法,strip.

英文的意思如下:

  • vt. 剥夺;剥去;脱去衣服
  • n. 带;条状;脱衣舞
  • vi. 脱去衣服

line=line.strip('\n') 像这样,把换行符脱掉就OK了。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值