pandas.DataFrame.to_excel:在同一个sheet内追加数据

本文介绍了如何使用pandas和openpyxl库在Excel中追加数据,避免覆盖原有内容。关键在于设置ExcelWriter的mode为a(append)和if_sheet_exists为overlay,同时使用startrow参数从原表的第一个空行开始写入新的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考了这篇文章的方法 pandas to_excel:写入数据,在同一个sheet中追加数据,写入到多个sheet里,基本逻辑是:

通过数据框获取到该Excel表的行数 df_rows,然后将需要存储的数据,限制开始写入的行数,即:startrow=df_rows+1 (原表中第一个空行),然后写入到同一个sheet中。这个方法不会覆盖原来的数据,实现在同一个sheet中追加数据。

以及这两个帖子:Export dataframe to xlsx - Error “zipfile.BadZipFile: File is not a zip file”

BUG: ExcelWriter.book - attribute not accessible for setting #48780

代码

with pd.ExcelWriter(path, engine='openpyxl', mode='a',if_sheet_exists='overlay') as writer:
	df1 = pd.DataFrame(pd.read_excel(path, sheet_name='sheet1')) 
	df_rows = df1.shape[0] #获取原数据的行数
	#将数据df写入excel中的sheet1表,从第一个空行开始写:
	df.to_excel(writer, sheet_name='sheet1',startrow=df_rows+1, index=False, header=False)

几个重点:

  • ExcelWriter的mode{‘w’, ‘a’}设为a Append 模式
  • ExcelWriter的if_sheet_exists{‘error’, ‘new’, ‘replace’, ‘overlay’}设定为overlay模式覆盖: 将内容写入现有sheet,无需先删除,但可能会覆盖现有内容。
  • 为了避免覆盖现有内容,要告诉to_excel方法从新的一行开始写,也就是说把to_excel的参数startrow设为“原行数+1”
你可以按照以下步骤来实现按第一列题号合并的操作: 1. 在循环遍历工作之前,先创建一个空的字典,用于存储每个题号对应的数据。 2. 在循环遍历每个工作数据时,使用`data.iterrows()`遍历每一行数据。 3. 对于每一行数据,检查第一列的题号是否已经存在于字典中。 - 如果存在,则将当前行的数据追加到对应题号的数据中。 - 如果不存在,则在字典中创建一个新的键值对,键为题号,值为一个包含当前行数据的列。 4. 循环结束后,创建一个空的DataFrame来存储合并后的数据。 5. 遍历字典中的键值对,将每个题号对应的数据转换为DataFrame,并将其追加到合并后的DataFrame中。 6. 最后,将合并后的数据保存到新的Excel文件或工作。 下面是一个示例代码: ```python import pandas as pd # 读取Excel文件中的所有工作 excel_file = pd.ExcelFile('总.xls') sheets = excel_file.sheet_names # 创建一个空字典来存储题号对应的数据 merged_data_dict = {} # 循环遍历所有工作,将数据按题号合并到字典中 for sheet_name in sheets: data = pd.read_excel(excel_file, sheet_name) for index, row in data.iterrows(): question_number = row[0] # 假设题号在第一列 if question_number in merged_data_dict: merged_data_dict[question_number].append(row) else: merged_data_dict[question_number] = [row] # 创建一个空的DataFrame来存储合并后的数据 merged_data = pd.DataFrame() # 遍历字典中的键值对,将题号对应的数据追加到合并后的DataFrame中 for question_number, data_list in merged_data_dict.items(): merged_data = merged_data.append(data_list) # 将合并后的数据保存到新的Excel文件或工作 merged_data.to_excel('合并.xls', index=False) ``` 请注意,这只是一个示例代码,具体实现可能需要根据你的实际数据结构和需求进行调整。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值