Python实现doc文档转换成docx文档并读取内容

目的

记录一下如何将doc转成docx并读取其中内容

doc转为dock

import win32com.client as wc

# 表示启动
word = wc.Dispatch("Word.Application")
# 要转换的doc文档的位置
doc = word.Documents.Open(r"C:\Users\YANGGEOL\Desktop\Study\Python学习\Learner\\test1.doc")
# 转换后的位置和标题
doc.SaveAs(r"C:\Users\YANGGEOL\Desktop\Study\Python学习\Learner\\test1.docx", 12, False, "", True, "", False, False, False, False)
# 关闭doc
doc.Close
# 退出word
word.Quit

读取docx内容并输出

import docx

path = 'test1.docx'
file = docx.Document(path)

print("段落数:"+str(len(file.paragraphs)))  # 输出文档有多少段
for i in file.paragraphs:  # 循环输出每段的内容
    print(i.text)
    
print('**************')

print(file.paragraphs[89].text)  # 输出第89的段的内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值