目的
记录一下如何将doc转成docx并读取其中内容
doc转为dock
import win32com.client as wc
# 表示启动
word = wc.Dispatch("Word.Application")
# 要转换的doc文档的位置
doc = word.Documents.Open(r"C:\Users\YANGGEOL\Desktop\Study\Python学习\Learner\\test1.doc")
# 转换后的位置和标题
doc.SaveAs(r"C:\Users\YANGGEOL\Desktop\Study\Python学习\Learner\\test1.docx", 12, False, "", True, "", False, False, False, False)
# 关闭doc
doc.Close
# 退出word
word.Quit
读取docx内容并输出
import docx
path = 'test1.docx'
file = docx.Document(path)
print("段落数:"+str(len(file.paragraphs))) # 输出文档有多少段
for i in file.paragraphs: # 循环输出每段的内容
print(i.text)
print('**************')
print(file.paragraphs[89].text) # 输出第89的段的内容