openpyxl中读大批量数据的方法——Optimized reader

在处理大数据量的XLSX文件时,openpyxl提供了优化的迭代器模式。通过设置`use_iterators=True`加载工作簿,然后利用`iter_rows()`方法,如`ws.iter_rows('C1:D21282')`,可以有效地读取特定范围的数据,减少内存消耗。这种方法用于统计C列特定行数中各数值的出现次数,并能写入到新的Excel文件中。
摘要由CSDN通过智能技术生成

有时候,我们需要打开或写数据量非常大的XLSX文件,而openpyxl的通用方法将无法处理如此大的负载。令人高兴的是,openpyxl有两种模式,使我们可以用常量级的内存消耗来读取和写入无限量的数据。

本文首先介绍读大量数据的方法,写的方法我没有尝试,以后有了会贴上来,需要的可以参考http://packages.python.org/openpyxl/optimized.html

首先我们需要打开一个excel表格,与以往的打开方式少有不同,比如我们打开一个文件名为haggle的xlsx文件,其调用方式应该为

wb = load_workbook(filename = 'haggle.xlsx',use_iterators=True)我们发现后面多了一个use_iterators=True。

其次,我们需要打开该工作薄的一个具体的工作表(sheet):ws=wb.get_sheet_by

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值