我正在尝试使用zipfile在Python上读取受密码保护的Word文档。以下代码适用于不受密码保护的文档,但与受密码保护的文件一起使用时会出错。
try:fromxml.etree.cElementTreeimportXMLexceptImportError:fromxml.etree.ElementTreeimportXMLimportzipfile
psw="1234"WORD_NAMESPACE='{http://schemas.openxmlformats.org/wordprocessingml/2006/main}'PARA=WORD_NAMESPACE+'p'TEXT=WORD_NAMESPACE+'t'defget_docx_text(path):document=zipfile.ZipFile(path,"r")document.setpassword(psw)document.extractall()xml_content=document.read('word/document.xml')document.close()tree=XML(xml_content)paragraphs=[]forparagraphintree.getiterator(PARA):texts=[node.textfornodeinparagraph.getiterator(TEXT)ifnode.text]iftexts:paragraphs.append(''.join(texts))return'\n\n'.join(paragraphs)
使用受密码保护的文件运行get_docx_text()时,出现以下错误:
追溯(最近一次通话):
File"",line1,inrunfile('/Users/usernam