一、前因
每天要从电子表格里提取数据,表格文件有点大,如下:
并且表格每天都在增加数据,不停变大,用EXCEL2007打开那叫一个慢,其实有用的数据就是那么更新的几条。
二、思路
用PYTHON把几个表中每天更新的内容提取了出来,汇总在一个表中,此表较小,操作快。提取过程也是较慢,现就xlrd、openpyxl、xlwings三种读取方式作比较,择优选择。
三、结果
图为读取指定文件的指定SHEET的总行数,并计算所划的时间,单位为秒,越小越快。
读取XLS文件,用xlrd较快;读取xlsx文件,用openpyxl只读模式。
四、代码
import xlrd
import openpyxl
import xlwings
import datetime
t_0=datetime.datetime.now()#取出现在时间
fn=u'D:/xiong/1.xls'
app =xlwings.App(visible=False, add_book=False)
xls = app.books.open