解决:docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’

解决:docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’





背景

在使用之前的代码时,报错:
Traceback (most recent call last):
File , line 1, in
file=docx.Document(“C:/Users/Administrator/Desktop/选择/add.doc”)
docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’



报错问题


  Traceback (most recent call last): 
    File , line 1, in  
      file=docx.Document("C:/Users/Administrator/Desktop/选择/add.doc") 
  docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’



报错翻译

主要报错信息内容翻译如下所示:


  Traceback (most recent call last): 
    File , line 1, in  
      file=docx.Document("C:/Users/Administrator/Desktop/选择/add.doc") 
  docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’

翻译:


  回溯(最近一次调用最后一次): 
 file=docx.Document("C:/Users/Administrator/Desktop/选择/add.doc")
 中的文件 “”,第 1 行 
 错误:未找到 rarfile 的匹配发行版



报错位置代码


...
import docx
      file=docx.Document("C:/Users/Administrator/Desktop/选择/add.doc") 
    print(js)
...



报错原因

经过查阅资料,发现是使用docx.Document()读取文件的时候,支持读取 .docx 文件,不支持读取 .doc 文件,不是 .docx 需要转换成 .docx。

小伙伴们按下面的解决方法即可解决!!!



解决方法

要解决这个错误,需要使用wps打开文件另存为docx,才可以解决此问题。

正确的代码是:


...
import docx 
file=docx.Document("C:/Users/Administrator/Desktop/选择/add.doc") 
for para in doc.paragraphs:
    print(para.text)
...

网上也找了很多其他答案,能够解决问题的还有以下几种:

  • 因为word文件是空的,在文件里加一些内容就可以

  • 在文件里加几个空格就可以解决

  • 在使用SaveAs2()函数时,第二个参数代表存储格式,16代表的存储格式为doc,12代表的存储格式为docx。存储格式设置成12后,python-docx就能读取文件了,代码示例如下。

正确的代码如下:

# encoding=utf-8
 
from win32com import client as wc
 
w = wc.gencache.EnsureDispatch('kwps.application')
doc = w.Documents.Open(r"C:/Users/Administrator/Desktop/选择/add.doc")
doc.SaveAs2(r"C:/Users/Administrator/Desktop/选择/add.docx", 12) # 问题出在这,必须为12

使用上述例子时,还需要注意:

  1. 需要用到win32com这个包,不是Python内建的,需要通过python -m pip install pypiwin32安装。

  2. 要用gencache.EnsureDispatch这个函数才行,网上其他大神用的方法不行。另外,如果你的电脑只安装了WPS,函数参数就得是“kwps.application”,如果有Office,参数就不是这个了。

  3. Open方法内的文件路径得用绝对路径,用相对路径的话我反正报错。

  4. 另存为不用SaveAs,要用SaveAs2,参数是绝对路径。

参考内容

100%解决docx.opc.exceptions.PackageNotFoundError: Package not found at
Python 将doc转化为docx



今天的分享就到此结束了

欢迎点赞评论关注三连

在这里插入图片描述

  • 7
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ninghes

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值