一、Excel
1、Excel文件三个对象
workbook: 工作簿,一个excel文件包含多个sheet。
sheet:工作表,一个workbook有多个,表名识别,如“sheet1”,“sheet2”等。
cell: 单元格,存储数据对象
2、excel定义的图
excel定义的图分两级类别描述,第一级分别有九大类,如下所示
area: 面积图
bar: 转置直方图
column: 柱状图
line: 直线图
pie: 饼状图
doughnut: 环形图
scatter: 散点图
stock: 股票趋势图
radar: 雷达图
3、csv格式读写excel数据
现在我们已经在 Python 中拿到了想要的数据,对于这些数据我们可以先存放起来,比如把数据写入 csv 中。定义一个 writeDate 方法:
import csv #导入包
def writeData(data, name):
with open(name, 'a', errors='ignore', newline='') as f:
f_csv = csv.writer(f)
f_csv.writerows(data)
print('write_csv success')
writeData(result, 'D:/py_work/venv/Include/weather.csv') #数据写入到 csv文档中
二、python与excel
1、python处理excel主流代表有:
二、openpyxl基本用法
openpyxl专门处理Excel2007及以上版本产生的xlsx文件,可读可写excel表。
openpyxl定义了多种数据格式其中最重要的三种:
NULL空值:对应于python中的None,表示这个cell里面没有数据。
numberic: 数字型,统一按照浮点数来进行处理。对应于python中的float。
string: 字符串型,对应于python中的unicode。
openpyxl中有三个不同层次的类:
Workbook是对工作簿的抽象,
Worksheet是对表格的抽象,
Cell是对单元格的抽象,
1、Workbook:
一个Workbook对象代表一个Excel文档,因此在操作Excel之前,都应该先创建一个Workbook对象。
对于创建一个新的Excel文档,直接进行Workbook类的调用即可,对于一个已经存在的Excel文档,可以使用openpyxl模块的load_workbook函数进行读取。
一个工作簿(workbook)在创建的时候同时至少也新建了一张工作表(worksheet)。
1.1Workbook属性:
●active:获取当前活跃的Worksheet
●worksheets:以列表的形式返回所有的Worksheet(表格)
●read_only:判断是否以read_only模式打开Excel文档
●encoding:获取文档的字符集编码
●properties:获取文档的元数据,如标题,创建者,创建日期等
●sheetnames:获取工作簿中的表(列表)
1.2Workbook方法(大部分方法都与sheet有关):
●get_sheet_names:获取所有表格的名称(新版已经不建议使用,通过Workbook的sheetnames属性即可获取)
●get_sheet_by_name:通过表格名称获取Worksheet对象(新版也不建议使用,通过Worksheet[‘表名‘]获取)
●get_active_sheet:获取活跃的表格(新版建议通过active属性获取)
●remove_sheet:删除一个表格
●create_sheet:创建一个空的表格
●copy_worksheet:在Workbook内拷贝表格
2、Worksheet:
有了Worksheet对象以后,我们可以通过这个Worksheet对象获取表格的属性,得到单元格中的数据,修改表格中的内容。
2.1Worksheet属性:
●title:表格的标题
●row_dimensions[2].height = 40 # 第2行行高
●column_dimensions['C'].width = 30 # C列列宽
●max_row:表格的最大行
●min_row:表格的最小行
●max_column:表格的最大列
●min_column:表格的最小列
●rows:按行获取单元格(Cell对象) - 生成器
●columns:按列获取单元格(Cell对象) - 生成器
●freeze_panes:冻结窗格
●values:按行获取表格的内容(数据) - 生成器
2.2Worksheet方法:
●iter_rows:按行获取所有单元格,内置属性有(min_row,max_row,min_col,max_col)
●iter_columns:按列获取所有的单元格
●append:在表格末尾添加数据
●merged_cells:合并多个单元格
●unmerged_cells:移除合并的单元格
3、Cell:
3.1Cell属性:
●row:单元格所在的行
●column:单元格坐在的列
●value:单元格的值
●coordinate:单元格的坐标 # excel2[‘abc‘].cell(row=1,column=2).coordinate
3.2单元格样式
openpyxl的单元格样式由6种属性决定,每一种都是一个类,如下所示:
●font(字体类):字号、字体颜色、下划线等
●fill(填充类):颜色等
●border(边框类):设置单元格边框
●alignment(位置类):对齐方式
●number_format(格式类):数据格式
●protection(保护类):写保护
基本字体颜色
字体颜色有一些颜色常量,可以直接调用:
from openpyxl.styles import Font
from openpyxl.styles.colors import RED
font = Font(color=RED)
font = Font(color="00FFBB00")
4、openpyxl图表:
Area Charts: 面积图
Bar and Column Charts : 转置直方图
Bubble Charts
Line Charts: 直线图
Scatter Charts: 散点图
Pie Charts: 饼状图
Doughnut Charts: 环形图
Radar Charts: 雷达图
Stock Charts: 股票趋势图
Surface Charts
column: 柱状图
三、使用介绍
1、Workbook
import openpyxl
WB=openpyxl.Workbook() #新建一个工作簿(workbook)
WB.save('xxx.xlsx') #保存并关闭工作簿
import openpyxl
WB=openpyxl.Workbook() #新建一个工作簿(workbook)
sh=WB.active #激活
WB.save('xxx.xlsx') #保存并关闭工作簿
import openpyxl
WB=openpyxl.load_workbook(filename = 'xxx.xlsx')#调用已有的工作簿(workbook)
WB.save('xxx.xlsx') #保存并关闭工作簿
import openpyxl
wb = openpyxl.load_workbook(filename = 'xxx.xlsx')#调用已有的工作簿(workbook)
sh = wb['Sheet'] #通过sheet名来访问sheet
print(sh['D18'].value) #获取cell值
2、worksheet
新建sheet
import openpyxl
wb=openpyxl.load_workbook(filename = 'xxx.xlsx')#调用已有的工作簿(workbook)
ws1=wb.active#调用正在运行的工作表
ws2 = wb.create_sheet() #新建sheet
ws4 = wb.create_sheet("NewTitle") #新建sheet并设定sheet名称
ws3 = wb.create_sheet(index=0) #新建sheet并指定sheet位置次序。系统自动命名,依次为Sheet, Sheet1, Sheet2
ws5 = wb.create_sheet('Data',index=1)#新建工作表并设定sheet名称,指定sheet位置次序
ws5.title = "NewTitle2" # 修改sheet表名称,直接赋值即可
ws7= wb["Sheet1"] #通过名字打开sheet
wb.remove(ws7) #删除某个工作表
wb.save('xxx.xlsx')
获取名字
import openpyxl
WB=openpyxl.load_workbook(filename = 'xxx.xlsx')#调用已有的工作簿(workbook)
sh1=WB.active
aa=WB.sheetnames[5] #按次序获取第6个sheet名
print(aa)
bb=WB.sheetnames #获取所有sheet名
print(bb)
cc=sh1.title #获取sheet名,默认取最后创建的那个sheet的名称
print(cc)
dd=['深圳市', '2020-09-02', '15:50:00', '08:00:00', '1970-01-01', '一达通未签约']
f=bb[3] #第四个sheet页的名称
sh2=WB[f] #按名称获取sheet
sh2.append(dd)#写数据
print(sh2.title)#获取当前sheet名
WB.save('xxx.xlsx') #保存并关闭工作簿
读写单元格
import openpyxl
wb=openpyxl.load_workbook(filename = 'xxx.xlsx')#调用已有的工作簿(workbook)
ws=wb.active
d1=ws.max_column #获得最大列
d2=ws.max_row #获得最大行
wb["sheet33"].max_row #获得最大列
wb["sheet33"].max_column #获得最大行
d3=ws['A4'] #根据单元格的索引获取单元格,如果不存在将在A4新建一个
d3=ws["B3"].value #取值
d4=ws.cell(row = 4, column = 2) #使用cell()方法通过行列获取单元格(行号列号从1开始)
d4=ws.cell(row=3, column=2).value #取值
cell_range1= ws['C'] #获取C列,cell_range1是tuple类型
cell_range2= ws[6] #获取第10行
cell_range3= ws['C:D']#获取C到D列
cell_range4= ws[3:7] #获取第3到7行
cell_range5= ws['A1':'C2'] #使用切片获取多个单元格
ws.rows #迭代读取所有行row ,生成器,里面是每一行的数据,每一行都是一个tuple。
ws.columns #迭代读取所有列column
#输出cell_range1和cell_range2的数据
for row in cell_range1:
print(row.value)
#输出cell_range3、cell_range4和cell_range5的数据
for row in cell_range3:</