python 操作Excel
本文借此机会,记录使用python 读写excel 的过程。
相关资料
全局概述
xlsxwriter
只支持写,可以写大量数据,行数最多达到1,000,000以上,列数最多超过16,000。
支持大量数据的写法:
workbook = xlsxwriter.Workbook(filename, {'constant_memory': True})
openpyxl
支持读写,读写速度一般,行数越多越慢,行上限65536,列上限256.
有读和写优化,优化效果一般,如果用优化写法需要用append一行内容。
optimized read :
from openpyxl import load_workbook
wb = load_workbook(filename='large_file.xlsx', read_only=True)
ws = wb['big_data'] # ws is now an IterableWorksheet
for row in ws.rows:
for cell in row:
print(cell.value)
optimized writer
>> from openpyxl import Workbook >> wb = Workbook(write_only=True) >> ws = wb.create_sheet() >> >> # now we'll fill it with 100 rows x 200 columns >> >> for irow in range(100): ... ws.append(['%d' % i for i in range(200)]) >> # save the file >> wb.save('new_big_file.xlsx')
or
>>> from openpyxl import Workbook
>>> wb = Workbook(optimized_write = True)
>>> ws = wb.create_sheet()
>>> from openpyxl.writer.dump_worksheet import WriteOnlyCell
>>> from openpyxl.comments import Comment
>>> from openpyxl.styles import Style, Font
>>> cell = WriteOnlyCell(ws, value="hello world")
>>> cell.font = Font(name='Courrier', size=36)
>>> cell.comment = Comment(text="A comment", author="Author's Name")
xlrd
支持xlsx,xls,只可以读,操作容易,行列受限,同openpyxl
xlwt
支持xls,只可以写,操作容易,配合xlrd,行列受限。
实验结果:
对比测试,
- openpyxl 读写
- openpyxl读,xlsxwriter写
- xlrd读,xlsxwriter写
综上比较,前两者性能相似如下:
N表示行数,列数固定采用40列,进行从一个excel读,写到另一个excel.
N=100 -> 35s
N=200 -> 2m05s
N=500 ->12m05s
N=4000 ->数小时
采用xlrd和xlsxwriter读写:
xlrd加载4000行需要1m20s。(主要慢在加载excel上,load)
N=2000 -> 1m 15s
N=4000 -> 2m39s
这是什么差距,OMG。就写到这里,回去睡觉了。稍后附上程序。