大家好,给大家分享一下python如何处理数据量很大的excel文件,很多人还不知道这一点。下面详细解释一下。现在让我们来看看!
电子表格格式
我们在日常工作中常常见到各种后缀的电子表格,例如最常见的xlsx以及较为常见的csv、xls等格式的表格。同样是电子表格,它们之间有什么区别吗?
• xls为Excel早期表格格式有趣简单的python程序代码。
xls格式是Excel2003版本及其以前版本所生成的文件格式。其最大的特点就是:仅有65536行、256列。因此规模过大的数据不可以使用xls格式读写。
• xlsx为Excel2007及其之后的表格格式,也是现在Excel表格的主流格式。
与xls相比,它可以存储1048576行、16384列数据,存储相同数据,xlsx格式要比xls格式文件要小得很多。
• CSV为逗号分隔值文件。
CSV逗号分隔值文件格式,其以纯文本形式存储表格数据(数字和文本),可以用Excel软件打开。
• xlrd 模块既可读取 xls 文件也可读取 xlsx 文件;xlwt只可写 xlsx 文件;openpyxl 可以读写 xlsx 文件;pandas 可以同时读写 xls、xlsx 文件。
注:xlrd 2.0.0 及更高版本只能读取 .xls 文件,建议使用其他库读取 .xlsx文件 或 安装 xlrd 早期版本。
1.使用 xlrd 来处理
xlrd命令