读取方法
- 把Excel文件导出为csv文件,再用python csv包读取,这种方法对于处理一两个Excel文件可以,如果有上万个Excel文件,手工导出是不可能的。
- 用xlrd包读取Excel文件,写这篇博客的时候,xlrd已经更新到(
xlrd 0.9.4
)。
步骤
- 打开Excel文件工作簿
- 根据名称找到工作表,根据行数(nrows)和列数(ncols)读取单元格内容。
- 打印读取的数据
Python 代码
import xlrd
file = "inputFile"
wb = xlrd.open_workbook(filename = file)
ws = wb.sheet_by_name('Sheet1')
dataset = []
for r in xrange(ws.nrows):
col = []
for c in range(ws.ncols):
col.append(ws.cell(r,c).value)
dataset.append(col)
from pprint import pprint
pprint(dataset)
输入文件:
输出结果:
[[u'aaa', u'bbb', u'cccc', u'dddd', u'eeee', u'ffff'],
[u'zzz', u'xxxx', u'cccc', u'vv', u'ddd', u'l;kjlkjgk'],
[524356235.0, u'sgdfgsdf', u'fdsa', '', '', ''],
[u'fadsf', u'ffad', '', '', '', ''],
[u'fadf', '', '', '', '', ''],
[u'fsad', u'fasd', u'fasdf', '', '', ''],
['', '', u'fsadf', '', '', '']]
补充说明
open_workbook
有个on_demand
参数,在设置它为True
的时候,工作表会按需加载到内存。- Excel写入用另一个Python 包——xlwt。