openpyxl中读大批量数据的方法——Optimized reader

最新推荐文章于 2024-08-18 22:00:18 发布

番茄小姐z先生

最新推荐文章于 2024-08-18 22:00:18 发布

阅读量8.8k

点赞数 1

分类专栏： python 文章标签： openpyxl python 读大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ao_xue1234/article/details/8194975

版权

在处理大数据量的XLSX文件时，openpyxl提供了优化的迭代器模式。通过设置`use_iterators=True`加载工作簿，然后利用`iter_rows()`方法，如`ws.iter_rows('C1:D21282')`，可以有效地读取特定范围的数据，减少内存消耗。这种方法用于统计C列特定行数中各数值的出现次数，并能写入到新的Excel文件中。

摘要由CSDN通过智能技术生成

有时候，我们需要打开或写数据量非常大的XLSX文件，而openpyxl的通用方法将无法处理如此大的负载。令人高兴的是，openpyxl有两种模式，使我们可以用常量级的内存消耗来读取和写入无限量的数据。

本文首先介绍读大量数据的方法，写的方法我没有尝试，以后有了会贴上来，需要的可以参考http://packages.python.org/openpyxl/optimized.html。

首先我们需要打开一个excel表格，与以往的打开方式少有不同，比如我们打开一个文件名为haggle的xlsx文件，其调用方式应该为

wb = load_workbook(filename = 'haggle.xlsx',use_iterators=True)我们发现后面多了一个use_iterators=True。

其次，我们需要打开该工作薄的一个具体的工作表（sheet）：ws=wb.get_sheet_by

最低0.47元/天解锁文章

番茄小姐z先生

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。