参考了这篇文章的方法 pandas to_excel:写入数据,在同一个sheet中追加数据,写入到多个sheet里,基本逻辑是:
通过数据框获取到该Excel表的行数 df_rows,然后将需要存储的数据,限制开始写入的行数,即:startrow=df_rows+1 (原表中第一个空行),然后写入到同一个sheet中。这个方法不会覆盖原来的数据,实现在同一个sheet中追加数据。
以及这两个帖子:Export dataframe to xlsx - Error “zipfile.BadZipFile: File is not a zip file”
BUG: ExcelWriter.book - attribute not accessible for setting #48780
代码
with pd.ExcelWriter(path, engine='openpyxl', mode='a',if_sheet_exists='overlay') as writer:
df1 = pd.DataFrame(pd.read_excel(path, sheet_name='sheet1'))
df_rows = df1.shape[0] #获取原数据的行数
#将数据df写入excel中的sheet1表,从第一个空行开始写:
df.to_excel(writer, sheet_name='sheet1',startrow=df_rows+1, index=False, header=False)
几个重点:
- ExcelWriter的
mode{‘w’, ‘a’}
设为a
Append 模式 - ExcelWriter的
if_sheet_exists{‘error’, ‘new’, ‘replace’, ‘overlay’}
设定为overlay模式覆盖: 将内容写入现有sheet,无需先删除,但可能会覆盖现有内容。 - 为了避免覆盖现有内容,要告诉to_excel方法从新的一行开始写,也就是说把to_excel的参数
startrow
设为“原行数+1”