提到表格,肯定会首先想到Excel;其实,除了微软的电子表格,在Linux系统中也有很好的电子表格,Google也提供了不错的在线电子表格。从历史到现在,电子表格都有很广泛的用途。所以,Python也要操作一番电子表格,因为有些数据,就是存在于电子表格中。
1,
openpyl
openpyl模块是解决Microsoft Excel 2007/2010之类版本中扩展名是Excel 2010 xlsx/xlsm/xltx/xltm的文件的读写的第三方库。
安装(打开shell模块):
C:\Windows\system32>pip install openpyxl
workbook和sheet
Workbook
提供的方法如下:
active:获取当前活跃的Worksheetworksheets:以列表的形式返回所有的Worksheet(表格)read_only:判断是否以read_only模式打开Excel文档encoding:获取文档的字符集编码properties:获取文档的元数据,如标题,创建者,创建日期等sheetnames:获取工作簿中的表(列表)
get_sheet_names
:获取所有表格的名称(新版已经不建议使用,通过
Workbook
的
sheetnames
属性即可获取)
get_sheet_by_name
:通过表格名称获取
Worksheet
对象(新版也不建议使用,通过
Worksheet
[‘表名‘]
获取)
get_active_sheet
:获取活跃的表格(新版建议通过
active
属性获取)
remove_sheet
:删除一个表格
create_sheet
:创建一个空的表格
copy_worksheet
:在
Workbook
内拷贝表格
Worksheet
提供的方法如下:
title:表格的标题
dimensions:表格的大小,这里的大小是指含有数据的表格的大小,即:左上角的坐标:右下角的坐标
max_row:表格的最大行min_row:表格的最小行max_column:表格的最大列min_column:表格的最小列rows:按行获取单元格(Cell对象) - 生成器columns:按列获取单元格(Cell对象) - 生成器freeze_panes:冻结窗格values:按行获取表格的内容(数据) - 生成器
(打开交互模式):
>>> from
openpyxl
import
Workbook
#引入Workbook 模块
>>> wb =
Workbook
() #用Workbook()类里面的方法展开工作 wb = Workbook("D://test.xlsx")创建指定文件
>>> ws =
wb.active
>>> ws1 =
wb.create_sheet
() #增加一个sheet
>>> ws.
title
= "python" #给第一个sheet命名
>>> ws01 = wb['python'] #按名称获取表格的sheet
>>> ws is ws01 #判断是否存在
True
>>> print wb.
sheetnames
#打印所有sheet
[u'python', u'Sheet1']
>>> for sh in wb: #遍历
print sh.title
python
Sheet1
cell:
cell对象提供如下方法:
row:单元格所在的行column:单元格坐在的列
value
:单元格的值coordinate:单元格的坐标
对于Sheet,其中的cell是它的下级单位。所以,要得到某个cell可以这样:
>>> a1 = ws['A1']
如果A1这个cell已经有了,用这种方法就是将它的值赋给了变量a1;如果sheet中没有这个cell,那么就创建这个cell对象。
注意,当我们打开Excel,默认已经画好了很多cell。但是,在Python操作的电子表格中,
不会默认画好那样一个表格,一切都要创建之后才有。所以,如果按照前面的操作流程,上面就是创建了A1这个
cell,并且把它作为一个对象被a1变量引用。
>>> ws['A1'] = 333 #给A1添加数据
>>> a1.value #获取A1的值
333
获取cell对象还可以这样:
>>> cells = ws["A1":"B1":"C1"] #批量获取
>>> ws['A2']=444
>>> ws['B1']="dadasd"
>>> wb.
save
("D://test.xlsx") #保存文件
读取已知文件:
>>> from openpyxl import load_workbook #引入load_workbook模块
>>> wb2 = load_workbook("D://test.xlsx") #打开已知文件
>>> print wb2.sheetnames #获取文件sheel
[u'python', u'Sheet1']
>>> ws_wb2 = wb2["python"]
>>> for row in ws_wb2.rows:
for cell in row:
print cell.value
333
dadasd
444
None
2,
其他第三方库
针对表格的第三方库,除了上面这个openpyxl之外还有别的,下面列出几个仅供参考,使用方法大同小异。
xlsxwriter:针对Excel 2010格式,如.xlsx,官方网站:https://xlsxwriter.readthedocs.org/,这个官方文档写得图文并茂。非常好读。
下面两个是用来处理.xls格式的电子表表格:
xlrd:网络文件,
https://secure.simplistix.co.uk/svn/xlrd/trunk/xlrd/doc/xlrd.html?p=4966。
xlwt:网络文件,http://xlwt.readthedocs.org/en/latest/。