Python 读取大文件

最新推荐文章于 2024-07-06 02:51:37 发布

昵称诚诚

最新推荐文章于 2024-07-06 02:51:37 发布

阅读量1.7k

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jobschen/article/details/50476872

版权

Python 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

最近在用python处理日志分析数据，但是有些文件比较大，几个G,如果用linecache 或都直接open整个文件，readlines 都容易导致占用过多内存，

导致程序停止执行。

Google了一下，python读取大文件的方法有以下几种：

个人推荐第一种，实测程序跑得刚刚的。

一、用with 读取大文件

with读取是非常Pythonic的方法，示例如下：

with open(filepath) as f:
    for line in f:
        <do something with line>

这个方法是在Stackoverflow上找到，这位高手对with读取的解释是这样的：

The with statement handles opening and closing the file, including if an exception is raised in the inner block. The for line in f treats the file object f as an iterable, which automatically uses buffered IO and memory management so you don't have to worry about large files.

大意就是with负责处理open和close文件，包括抛出内部异常。而for line in f将文件对象f当做迭代对象，将自动处理IO缓冲和内存管理，这样你无需担心大文件的处理了。

二、使用fileinput 模块

示例代码如下：

import fileinput
for line in fileinput.input(['sum.log']):
    print line

第一种更Pythonic，也无需import，而且还能处理close和Exception，所以更推荐使用。

在文件处理时，读取整行，每行后会有一个换行符。python 其实也提供了一个方法，strip.

英文的意思如下：

vt. 剥夺；剥去；脱去衣服
n. 带；条状；脱衣舞
vi. 脱去衣服

line=line.strip('\n') 像这样，把换行符脱掉就OK了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python 读取大文件

最近在用python处理日志分析数据，但是有些文件比较大，几个G,如果用linecache 或都直接open整个文件，readlines 都容易导致占用过多内存，导致程序停止执行。Google了一下，python读取大文件的方法有以下几种：个人推荐第一种，实测程序跑得刚刚的。一、用with 读取大文件with读取是非常Pythonic的方法，示例如下：
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。