excel_py常用模块有openpyxl和panda这两种,自己只用过openpyxl,在此记录学习
openpyxl中,对excel的方式其实也有很多种,各种方式之间比较容易混淆,导致运行报错,所以建议选定一两种方式作为自己常用的,每一种方式基本都有各自对应excel操作的一些方法【建议搜索:python3 open_workbook[区分方式的基础] 或者xlwt[模块,因为自带方法都是建立在模块的基础上] copy[需要搜索的操作]】
注意:xlsx、xls、csv的方法不能共用,需要区分
常用包
import xlrd #读xls、xlsx
import os #输入输出
import openpyxl #xlsx
import sys #系统操作
import os, sys, re # 【另一种导入方式】
import xlwt #xls、xlsx写入操作
from xlutils.copy import copy #xls、xlsx写入操作
import glob #全局读取所有文件
xlsx
打开xlsx文件
src1 = sys.argv[1]
wb_src1 = openpyxl.load_workbook(src1)
创建表对象
ws1_src1 = wb_src1['***']
获取最大行列
sep1 = ws1_des.max_row # 目标文件分隔符,方便后续结果的补充【可作为一种应用】
sep2 = ws2_des.max_row
ws1_des['C{}'.format(sep1 + r)].value = ws1_src1['A{}'.format(r + 1)].value #文件分隔示例
获取单元格的值
for r in range(1, ws1_src1.max_row): # 遍历数据行
ws1_des['C{}'.format(sep1 + r)].value = ws1_src1['A{}'.format(r + 1)].value #
保存excel文件
des = sys.argv[3] # 目的xl
wb_des = openpyxl.load_workbook(des) # 目的xl
wb_des.save(des) # 保存目的文件【des也可以通过拼接、替换、或者直接输入具体路径的方式,将修改后的文件另存到其他路径】
xls
创建workbook(工作簿)
new_wb = xlwt.Workbook(encoding='utf-8') # 注意这里的Workbook首字母是大写,无语吧,注意这里只能生成xls,不能生成xlsx
创建工作表
new_ws = new_wb.add_sheet('wvs')
工作表样式
new_ws.col(1).width = 320 * 20
不常用
style = xlwt.XFStyle() # 初始化样式
font = xlwt.Font() # 为样式创建字体
font.name = 'Times New Roman'
font.bold = True # 黑体
font.underline = True # 下划线
font.italic = True # 斜体字
style.font = font # 设定样式
worksheet.write(0, 0, 'Unformatted value') # 不带样式的写入
worksheet.write(1, 0, 'Formatted value', style) # 带样式的写入
单元格操作
new_ws.write(1,0, label = 'this is test') # 参数对应 行, 列, 值
xlsx与xls公用
打开工作簿
wb = xlrd.open_workbook(xls,formatting_info=True) #打开excel表,保留样式
获取指定sheet
src_sh = src.sheet_by_name('sheet1')
#获取行数、列数
nrows = ws.nrows
ncols = ws.ncols
新建工作簿添加数据
des=Workbook()
des_sh['A1'] = '发现时间'
单元格操作
#将源文件某单元格的值复制到新工作簿的单元格
v=src_sh.cell(ri,1).value#源文件参数【cell函数,行列索引从0开始】
des_sh['A'+str(row_num)]=v#目的文件列,对应段标题D【数组,行列索引从1开始】
【如果操作行列较多,而且行列号规律性增减明显,则推荐使用数字索引进行操作(也更符合编程方式);
如果操作不是很复杂,希望对应逻辑清晰一些,则考虑用字母索引方式】
在原来工作簿基础上修改数据并保存
new_wb=copy(wb)
new_ws = new_wb.get_sheet(0)
ws = wb.sheet_by_name('Sheet1')
#根据最大行列,遍历每个单元格
for i in range(nrows):
for j in range(ncols):
cell=str(ws.cell_value(i,j))#读数据还是要在原excel基础上读,因为新建的new_ws和ws所属类不同,很多方法不能共用
if (re.findall(queryText,cell)):
cell = cell.replace(queryText, 'xxx.xxx')
new_ws.write(i,j,cell)
new_wb.save(xls)
保存新建的工作簿
des.save('汇总.xlsx')#目的文件
读取文件夹下所有特定文件
all_xls=glob.glob('./**/**/**/*.xls');#根据脚本与处理文件的相对位置确定路径
重命名文件
os.rename(xls,new_xls)
合并单元格后,数据只存储于左上角一格