python读取加密word_Python-使用zipfile读取受密码保护的Word文档

本文介绍了尝试使用Python的zipfile模块读取受密码保护的Word文档时遇到的问题及解决方案。当尝试直接用zipfile打开加密文件时,会出现错误提示'BadZipfile: File is not a zip file'。解决方法是在调用如extractall、extract、open和read等方法时,传入密码参数,而非在ZipFile初始化时设置。同时,建议检查文件的其他属性,如所有权、权限和安全性上下文,确保文件正常。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我正在尝试使用zipfile在Python上读取受密码保护的Word文档。以下代码适用于不受密码保护的文档,但与受密码保护的文件一起使用时会出错。

try:fromxml.etree.cElementTreeimportXMLexceptImportError:fromxml.etree.ElementTreeimportXMLimportzipfile

psw="1234"WORD_NAMESPACE='{http://schemas.openxmlformats.org/wordprocessingml/2006/main}'PARA=WORD_NAMESPACE+'p'TEXT=WORD_NAMESPACE+'t'defget_docx_text(path):document=zipfile.ZipFile(path,"r")document.setpassword(psw)document.extractall()xml_content=document.read('word/document.xml')document.close()tree=XML(xml_content)paragraphs=[]forparagraphintree.getiterator(PARA):texts=[node.textfornodeinparagraph.getiterator(TEXT)ifnode.text]iftexts:paragraphs.append(''.join(texts))return'\n\n'.join(paragraphs)

使用受密码保护的文件运行get_docx_text()时,出现以下错误:

追溯(最近一次通话):

File"",line1,inrunfile('/Users/username/Workspace/Python/docx2txt.py',wdir='/Users/username/Workspace/Python')File"/Applications/Spyder-Py2.app/Contents/Resources/lib/python2.7/spyderlib/widge

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值