背景: python读取Excel表头时,多级表头有合并单元格,最开始使用read_excel时,因为底稿数据不标准,某列有数据但表头为空,导致读取 出的表头是前一列的表头.1,后期匹配时误差较大
公司技术大牛让我使用openpyxl,进行单列读取并判断多级表头是否都为空,再将结果传给pandas处理.处理的过程中需要取消合并单元格,直接使用下面代码,出现格式不正确,后面将采取用函数解决
ws.unmerge_cells(start_row=5,end_row=5)
def unmerge_all(sheet):
"""
将sheet中所有的合并单元格取消 并用合并值填充
Args:
sheet:
Returns:
"""
for merge_cell in list(sheet.merged_cells):
merge_value = merge_cell.start_cell.value
merge_style = merge_cell.start_cell._style
sheet.unmerge_cells(range_string=merge_cell.coord)
for row, column in merge_cell.cells:
sheet.cell(row, column, value=merge_value)._style = merge_style
return sheet
ws=unmerge_all(ws)
这是一个Python函数,其作用是将Excel工作表中所有合并的单元格解除合并,并将合并的单元格的值和样式应用到每个单独的单元格中。
具体步骤如下:
1.使用`list(sheet.merged_cells)`函数获取工作表中所有合并单元格的坐标信息,并将其存储在一个列表中。
2.遍历合并单元格列表中的每个合并单元格,并使用`merge_cell.start_cell.value`和`merge_cell.start_cell._style`分别获取合并单元格的值和样式。
3.使用`sheet.unmerge_cells(range_string=merge_cell.coord)`函数将当前合并单元格解除合并。
4.遍历当前合并单元格中的每个单元格,并使用`sheet.cell(row, column, value=merge_value)._style = merge_style`函数将合并单元格的值和样式分别应用到每个单独的单元格中。
5.返回解除合并单元格后的工作表对象。
注:`sheet`参数应该是一个`openpyxl`库中的工作表对象。