使用python将Excel中合并的单元格拆开,并且拆开后的每个单元格的值与原来的相同。
适用的场景是拿到一个Excel文件,但是这个文件使人工录入的,在一列之中可能存在着大量合并的单元格,为了满足数据分析的要求,需要将一列中多行合并单元格拆分成一个个的观测,并且每个观测的值与原来合并的值相等。
import openpyxl
workbook = openpyxl.load_workbook('data.xlsx') # 加载已经存在的excel
name_list = workbook.sheetnames
worksheet = workbook[name_list[0]]
m_list = worksheet.merged_cells # 合并单元格的位置信息,可迭代对象(单个是一个'openpyxl.worksheet.cell_range.CellRange'对象),print后就是excel坐标信息
cr = []
for m_area in m_list:
# 合并单元格的起始行坐标、终止行坐标。。。。,
r1, r2, c1, c2 = m_area.min_row, m_area.max_row, m_area.min_col, m_area.max_col
# 纵向合并单元格的位置信息提取出
if r2 - r1 > 0:
cr.append((r1, r2, c1, c2))
print('符合条件%s' % str(m_area))
#print(cr)
# 这里注意需要把合并单元格的信息提取出再拆分
for r in cr:
worksheet.unmerge_cells(start_row=r[0], end_row=r[1],
start_column=r[2], end_column=r[3])
for row in range(r[0], r[1]):
worksheet.cell(row=row+1, column=r[3], value=worksheet.cell(r[0], r[3]).value)
workbook.save('data.xlsx')
借鉴了:https://www.cnblogs.com/liuda9495/p/9039732.html,他是识别出Excel中被合并的单元格,根据需要我将每个拆分的单元格都赋值为合并前的值。
上述应用场景是在一列中存在着多行合并的单元格,如果涉及多行多列的合并,仅需在最后写入的时候再嵌入一个关于列的for循环即可。