Python-将Excel合并的单元格拆开，拆开后的每个单元格值与原来相同

最新推荐文章于 2024-05-09 17:24:43 发布

原创最新推荐文章于 2024-05-09 17:24:43 发布 · 4.8k 阅读

28 ·

CC 4.0 BY-SA版权

文章标签：

#excel

Python 专栏收录该内容

3 篇文章

订阅专栏

本文介绍使用Python和openpyxl库处理Excel中合并单元格的方法，通过代码实现拆分并保留原始值，适用于数据分析需求。

使用python将Excel中合并的单元格拆开，并且拆开后的每个单元格的值与原来的相同。
适用的场景是拿到一个Excel文件，但是这个文件使人工录入的，在一列之中可能存在着大量合并的单元格，为了满足数据分析的要求，需要将一列中多行合并单元格拆分成一个个的观测，并且每个观测的值与原来合并的值相等。

import openpyxl

workbook = openpyxl.load_workbook('data.xlsx')  # 加载已经存在的excel

name_list = workbook.sheetnames

worksheet = workbook[name_list[0]]

m_list = worksheet.merged_cells  # 合并单元格的位置信息，可迭代对象（单个是一个'openpyxl.worksheet.cell_range.CellRange'对象），print后就是excel坐标信息
cr = []
for m_area in m_list:
    # 合并单元格的起始行坐标、终止行坐标。。。。，
    r1, r2, c1, c2 = m_area.min_row, m_area.max_row, m_area.min_col, m_area.max_col
    # 纵向合并单元格的位置信息提取出
    if r2 - r1 > 0:
        cr.append((r1, r2, c1, c2))
        print('符合条件%s' % str(m_area))
#print(cr)
# 这里注意需要把合并单元格的信息提取出再拆分
for r in cr:
    worksheet.unmerge_cells(start_row=r[0], end_row=r[1],
                            start_column=r[2], end_column=r[3])
    for row in range(r[0], r[1]):
        worksheet.cell(row=row+1, column=r[3], value=worksheet.cell(r[0], r[3]).value)

workbook.save('data.xlsx')

借鉴了：https://www.cnblogs.com/liuda9495/p/9039732.html，他是识别出Excel中被合并的单元格，根据需要我将每个拆分的单元格都赋值为合并前的值。
上述应用场景是在一列中存在着多行合并的单元格，如果涉及多行多列的合并，仅需在最后写入的时候再嵌入一个关于列的for循环即可。