在接触Python的过程中,总是由于不大了解模块方法而产生畏难情绪。
特别是在已经熟悉了Excel之后,再学习用Python处理数据,还得从最简单的方法学起。
就例如比较大小这种在Excel里轻松实现的功能,在Python里如果从零开始琢磨,也得想很久。
下面是一些小经验,抛砖引玉。
目录
1. 打开文件
要在Python里导入Excel表格,先要导入xlrd 模块,通过 xlrd.open_workbook() 的方法来打开Excel文件。
打开了文件后,还需要指定读取哪个表(sheet),也就是上图Excel里左下角“2013”那里,可以用指定名称或位置编号(即index,从0开始),直接print sheet,会得到列表属性,有点像Pandas DataFrame.groupby()输出的结果,需要进一步读取:
import xlrd
workbook = xlrd.open_workbook(datafile)
sheet = workbook.sheet_by_index(0)
In [1]: print (workbook)
Out[1]: <xlrd.book.Book object at 0x000001F3A55EFD30>
2. 读取文件
a. 读取单元格、行、列
“读取”模块可以分为:
- 行操作(row)
- 列操作(column)
- 单元格操作(cell)
例如我们想得到B2单元格的信息:
在Python中对应是(1,1)单元格,在选定操作区域后,还可以指定输出值('_value')或类型('_type'),其中类型为一个编号,按顺序为['empty', 'string', 'number', 'date', 'boolean', 'error'],操作如下:
In [2]: print (sheet.cell(1,1))
Out[2]: number:7606.263544000012
In [3]: print (sheet.cell_value(1,1))
Out[3]: 7606.263544000012
In [4]: print (sheet.cell_type(1,