网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
目录
最近碰到一个问题,需要读取后缀为xlsx的文件,因此在此总结一下python对于xlsx文件的读写。
一般如果是后缀xls的话,用xlwt和xlrd进行读写;而后缀是xlsx的话,用openpyxl进行读写。在此主要介绍openpyxl库对xlsx的读写。
参考链接:python之openpyxl模块
xlsx文件的写入
新建工作簿和新建工作表
首先,openpyxl库中有个Workbook对象,其代表一个Excel文档。
Workbook提供的部分常用属性如下:
属性 | 含义 |
---|---|
active | 获取当前活跃的Worksheet |
worksheets | 以列表的形式返回所有的sheet对象(表格对象) |
read_only | 判断是否以read_only模式打开Excel文档 |
write_only | 判断是否以write_only模式打开Excel文档 |
encoding | 获取文档的字符集编码 |
properties | 获取文档的元数据,如标题,创建者,创建日期等 |
sheetnames | 以列表的形式返回工作簿中的表的表名(表名字符串) |
Workbook对象提供的部分常用方法如下:
方法 | 含义 |
---|---|
get_sheet_names | 获取所有表格的名称(新版已经不建议使用,通过Workbook的sheetnames属性即可获取) |
get_sheet_by_name | 通过表格名称获取Worksheet对象(新版也不建议使用,通过Workbook[‘表名‘]获取) |
get_active_sheet | 获取活跃的表格(新版建议通过active属性获取) |
remove_sheet | 删除一个表格 |
create_sheet | 创建一个空的表格 |
copy_worksheet | 在Workbook内拷贝表格 |
例如,如下代码创建一个名为data1的工作簿,在有默认sheet的基础上,为其创建一个新的sheet,名为sheet2。
from openpyxl import Workbook
# 创建一个Workbook对象
wb = Workbook()
# 如果不指定sheet索引和表名,默认在第二张表位置新建表名sheet1
wb.create_sheet(index=1, title="sheet2")
# 获取当前活跃的sheet,默认为第一张sheet
ws = wb.active
print(ws)
# 获取当前工作簿的所有sheet对象
sheets = wb.worksheets
print(sheets)
# 获取所有sheet的名字
sheets_name = wb.sheetnames
print(sheets_name)
# 保存为工作簿data1.xlsx
wb.save('data1.xlsx')
打印结果如下,结果可以看出,当前sheet名字为Sheet,新建的sheet名字为sheet2。wb.worksheets返回的是Worksheet对象,wb.sheetnames返回的是表名字符串列表。
<Worksheet "Sheet">
[<Worksheet "Sheet">, <Worksheet "sheet2">]
['Sheet', 'sheet2']
为工作表添加内容
Workbook对象代表一张工作簿,而其中有一张或多张sheet,这些sheet便是一个个Worksheet对象。
Worksheet对象的属性如下:
属性 | 含义 |
---|---|
title | 表格的标题 |
dimensions | 表格的大小,这里的大小是指含有数据的表格的大小,即:左上角的坐标:右下角的坐标 |
max_row | 表格的最大行 |
min_row | 表格的最小行 |
max_column | 表格的最大列 |
min_column | 表格的最小列 |
rows | 按行获取单元格(Cell对象) - 生成器 |
columns | 按列获取单元格(Cell对象) - 生成器 |
freeze_panes | 冻结窗格 |
values | 按行获取表格的内容(数据) - 生成器 |
Worksheet对象的方法如下: | |
方法 | 含义 |
:---- | :----- |
iter_rows | 按行获取所有单元格,内置属性有(min_row,max_row,min_col,max_col) |
iter_columns | 按列获取所有的单元格 |
append | 在表格末尾添加数据 |
merged_cells | 合并多个单元格 |
unmerged_cells | 移除合并的单元格 |
例如,如下代码新建一个data1.xlsx的工作簿,并为当前活跃的第一张sheet表添加了一行表头和两行数据。
from openpyxl import Workbook
# 创建一个Workbook对象
wb = Workbook()
# 获取当前活跃的sheet,默认是第一个sheet
ws = wb.active
ws['A1'] = 'class'
ws['B1'] = 'name'
ws['C1'].value = 'score'
row1 = ['class1', 'zhangsan', 90]
row2 = ['class2', 'lisi', 88]
ws.append(row1)
ws.append(row2)
wb.save('data1.xlsx')
添加之后结果如下:
对于一张sheet表,每一个格子是一个Cell对象,其可以用来定位表中任一位置。
Cell对象常用的属性如下:
属性 | 含义 |
---|---|
row | 单元格所在的行 |
column | 单元格坐在的列 |
value | 单元格的值 |
coordinate | 单元格的坐标 |
因此,也可以通过Cell对象为sheet添加内容。如下是为表添加表头的代码:
ws.cell(row=1, column=1) = 'class'
ws.cell(1,2).value = 'name'
ws.cell(1,3).value = 'score'
xlsx文件的读取
通过Cell对象读取每一格内容,代码如下:
from openpyxl import load_workbook
wb = load_workbook('data1.xlsx')
sheets = wb.worksheets # 获取当前所有的sheet
print(sheets)
# 获取第一张sheet
sheet1 = sheets[0]
# sheet1 = wb['Sheet'] # 也可以通过已知表名获取sheet
print(sheet1)
# 通过Cell对象读取
cell_11 = sheet1.cell(1,1).value
print(cell_11)
cell_11 = sheet1.cell(1,2).value
print(cell_11)
打印结果如下
[<Worksheet "Sheet">]
<Worksheet "Sheet">
class
name
读取表中的一行或者一列内容,代码如下:
from openpyxl import load_workbook
wb = load_workbook('data1.xlsx')
sheets = wb.worksheets # 获取当前所有的sheet
print(sheets)
# 获取第一张sheet
sheet1 = sheets[0]
print(sheet1)
# 获取第一行所有数据
row1 = []
print(sheet1[1])
for row in sheet1[1]:
print(row)
row1.append(row.value)
print(row1)
做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。
别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。
我先来介绍一下这些东西怎么用,文末抱走。
* * *
**(1)Python所有方向的学习路线(新版)**
这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
![在这里插入图片描述](https://img-blog.csdnimg.cn/8fc093dcfa1f476694c574db1242c05b.png)
**(2)Python学习视频**
包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
![在这里插入图片描述](https://img-blog.csdnimg.cn/d66e3ad5592f4cdcb197de0dc0438ec5.png#pic_center)
**(3)100多个练手项目**
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。
![在这里插入图片描述](https://img-blog.csdnimg.cn/f5aeb4050ab547cf90b1a028d1aacb1d.png#pic_center)
**(4)200多本电子书**
这些年我也收藏了很多电子书,大概200多本,有时候带实体书不方便的话,我就会去打开电子书看看,书籍可不一定比视频教程差,尤其是权威的技术书籍。
基本上主流的和经典的都有,这里我就不放图了,版权问题,个人看看是没有问题的。
**(5)Python知识点汇总**
知识点汇总有点像学习路线,但与学习路线不同的点就在于,知识点汇总更为细致,里面包含了对具体知识点的简单说明,而我们的学习路线则更为抽象和简单,只是为了方便大家只是某个领域你应该学习哪些技术栈。
![在这里插入图片描述](https://img-blog.csdnimg.cn/c741a91b05a542ba9dc8abf2f2f4b1af.png)
**(6)其他资料**
还有其他的一些东西,比如说我自己出的Python入门图文类教程,没有电脑的时候用手机也可以学习知识,学会了理论之后再去敲代码实践验证,还有Python中文版的库资料、MySQL和HTML标签大全等等,这些都是可以送给粉丝们的东西。
![在这里插入图片描述](https://img-blog.csdnimg.cn/9fa77af248b84885a6ec779b2ead064d.png)
**这些都不是什么非常值钱的东西,但对于没有资源或者资源不是很好的学习者来说确实很不错,你要是用得到的话都可以直接抱走,关注过我的人都知道,这些都是可以拿到的。**
**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**
**[需要这份系统化学习资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618317507)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**