利用Pandas拆分Excel的单元格为多行并保留其他行的数据

最新推荐文章于 2025-02-05 17:28:15 发布

Jock2018

最新推荐文章于 2025-02-05 17:28:15 发布

阅读量1.3w

点赞数 21

分类专栏：办公软件 Pandas 文章标签： Pandas Excel 拆分单元格

本文链接：https://blog.csdn.net/qq_27283619/article/details/96164836

版权

利用Pandas拆分Excel的单元格为多行并保留其他行的数据

1. 需求

需求：对Excel中的C列（标红）所有单元格的内容进行拆分，同时保证其他行不变。如果着急完成任务，直接看第二部分，copy代码，简单修改，跑程序。
处理前：

在这里插入图片描述

处理后
在这里插入图片描述

2. Pandas解决需求

2.1 准备工作

先复制C列的内容到D列，并更改列名为main_investigator_1。
对数据进行清洗，在Excel中用,替换、；/ & ; ：等特殊字符。
安装Anaconda。我用的是Anaconda + Pycharm。

2.2 Python程序执行

整体代码如下：

import pandas as pd

# 读取Excel
# 直接复制路径，Win下会有Bug，编码问题。所以Win下一定要手敲路径
df = pd.read_excel(r'C:\Users\admin\Desktop\test.xlsx')

# 拆分单元格
df = df.drop(['main_investigator_1'], axis=1).join(df['main_investigator_1'].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename('main_investigator_new'))

# 写入新的Excel
writer = pd.ExcelWriter(r'C:\Users\admin\Desktop\test2.xlsx')
df.to_excel(writer,'Sheet1')
writer.save()