python不同模块读取excel的特点对比

百里九十丶

于 2018-01-02 10:46:15 发布

阅读量1k

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011655220/article/details/78949461

版权

Python 专栏收录该内容

15 篇文章

订阅专栏

本文探讨了使用xlrd读取Excel数据时遇到的性能问题，特别是在处理4000-5000行数据时的明显延迟。通过对比不同数据量的处理时间，分析了xlrd的工作原理及其对性能的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近使用xlrd读取excel数据进行处理，发现当行数达到4000-5000以后，就会出现明显的性能问题，对比读取2000条数据的excel耗费时间会多60%的样子（粗略估计）。

使用行列索引和直接使用单元格的值一般无二，进入xlrd模块内部研究发现，模块内采用流的读取拉出数据并进行组合排列渲染，数据量的大小将直接影响运行速度，并且暂时无法找到优化办法。对于xls, 和xlsx后缀的文件，xlrd读取xls的速度是后者的一倍有多。

下面这幅对比图转自百度知道，对于它速度一项，我觉得有待商榷，可能是它描述不够具体，我认为5000条数据至少不应该算大文件。可能在这里已经算是了吧。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。