Google很多方法都不行,唯有自己看源码。
发现openpyxl处理ExternalData时会把ID解析为{http://schemas.openxmlformats.org/officeDocument/2006/relationships}id,从而丢失了ID的属性,当初始化类的时候就会因为ID值缺失而报错。
在不修改openpyxl的代码情况下,最可行的是把ExternalData的xml元素删掉。
# 除去图表的externalData属性,以便openpyxl读取
externalData_REGEX = re.compile(b'<c:externalData.*</c:externalData>')
with zipfile.ZipFile(f_电渠日报) as zf:
excel_obj = {zi.filename:zf.read(zi) for zi in zf.filelist}
with zipfile.ZipFile(f_电渠日报,'w') as zf1:
for zi, duffer in excel_obj.items():
zf1.writestr(zi,externalData_REGEX.sub(b'',duffer))