目的:实现文档数据滚动更新,每日将新增数据追加至表格。
原逻辑:使用pd.read_excel读取A文档数据,通过append追加内容,再使用to_excel将数据写入A文档。
问题:被读取的文档在python运行过程中属于打开状态,再次写入会报错:permission denied
原脚本:
import pandas as pd
data = pd.read_excel(A, sheet_name='测试')
#假设新数据集为new_data
data.append(new_data)
data.to_excel(excel_writer = A, sheet_name='测试', header=True, encoding='utf-8')
#此时报错permission denied
解决方案1:引入辅助文档B,适合更新时间不固定的数据。
先利用shutil.copyfile将最新的A文档复制为B文档,然后使用pd.read_excel读取B文档数据,通过append追加内容,再使用to_excel将数据写入A文档。在此过程中,A文档不会由于读取或复制被占用。
import pandas as pd
from shutil import copyfile
copyfile(A,B)
data = pd.read_excel(B, sheet_name='测试')
#假设新数据集为new_data
data.append(new_data)
data.to_excel(excel_writer = A, sheet_name='测试', header=True, encoding='utf-8')
解决方案2:重命名文档,适合需要每日更新的数据。
若数据每日更新,可直接使用日期命名文档,读取昨日文档,追加今日数据后保存为日期为今天的文档。
import pandas as pd
import datetime
yesterday = datetime.date.today() - datetime.timedelta(days=1)
today = datetime.date.today()
data = pd.read_excel(file_path + yesterday + '.xlsx', sheet_name='测试')
#假设新数据集为new_data
data.append(new_data)
data.to_excel(excel_writer = file_path + today + '.xlsx', sheet_name='测试', header=True, encoding='utf-8')