【Python】读取doc文档解决思路及代码\win32com打开Office|WPS\error: (-2147352567,

个人搜索到当前读取doc文档的解决办法,就是通过win32com打开并转换为docx,再通过docx库读取内容。
但这其中有两个地方很容易出错,一个是打开,事实证明只有client.Dispatch('Word.Application')可用。然后保存前一定要确保doc、docx是关闭的也就是不被占用,如果漏了加doc.Close(),则会一直被挂在后台。

附上代码


import win32com.client
import os
import docx

def output_docx_content(docx_path):
    # 打开转换后的 .docx 文件
    doc = docx.Document(docx_path)

    # 遍历文档中的段落并输出内容
    for paragraph in doc.paragraphs:
        print(paragraph.text)

    # 遍历文档中的表格并输出内容
    for table in doc.tables:
        for row in table.rows:
            for cell in row.cells:
                print(cell.text)


def convert_doc_to_docx(doc_path):
    # 创建Word对象
    wps = win32com.client.Dispatch("word.Application")
    # 打开文档
    doc = wps.Documents.Open(doc_path)

    docxNamePath = doc_path + "x"
    print('转换中...')

    if os.path.exists(docxNamePath):
        print(f"File '{docxNamePath}'已存在.")
        doc.Close()
        return docxNamePath

    doc.SaveAs(docxNamePath, 12)
    print('转换完成!' + docxNamePath)
    doc.Close()
    return docxNamePath

# 使用示例
doc_path = r'D:\path\document.doc'
new_docx_path = convert_doc_to_docx(doc_path)

output_docx_content(new_docx_path)



  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值