python读取超大csv文件_python – 读取一个巨大的.csv文件

江平舟

于 2021-02-04 14:39:45 发布

阅读量5.1k

点赞数

文章标签： python读取超大csv文件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29181861/article/details/113678503

版权

本文探讨了在Python 2.7中高效处理大型CSV文件的方法，针对内存限制及速度问题，提出了改进措施。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我目前正试图从Python 2.7中的.csv文件读取数据，最多1百万行和200列(文件范围从100mb到1.6gb)。我可以这样做(非常慢)对于300,000行以下的文件，但一旦我走上，我得到内存错误。我的代码看起来像这样：

def getdata(filename, criteria):

data=[]

for criterion in criteria:

data.append(getstuff(filename, criteron))

return data

def getstuff(filename, criterion):

import csv

data=[]

with open(filename, "rb") as csvfile:

datareader=csv.reader(csvfile)

for row in datareader:

if row[3]=="column header":

data.append(row)

elif len(data)<2 and row[3]!=criterion:

pass

elif row[3]==criterion:

data.append(row)

else:

return data

getstuff函数中的else子句的原因是所有符合条件的元素将一起列在csv文件中，所以我离开循环，当我得到它们以节省时间。

我的问题是：

>我如何能够使这个工作与更大的文件？

>有什么办法可以让它更快吗？

我的电脑有8GB RAM，运行64位Windows 7，处理器是3.40 GHz(不确定你需要什么信息)。

非常感谢任何帮助！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。