python-docx插件可以方便的操作docx文档,注意不是doc格式,这两种格式本质上是完全不一样的东西,doc需要使用win32com来操作,速度比较慢,python-docx的速度相比之下就太快了。
下面代码是合并纯文本(不含图片)的docx文档,暂只列出了合并两个文档的代码,可稍加修改做成合并无数个的功能。
from docx import Document
import re
files = "企业计划书范文(创办你的企业).docx"
#合并多个docx文件
def combine_word_documents(files):
# 新建一空文件,用来保存合并后的内容
merged_document = Document("template/通用.docx")
#读入一个文件
sub_doc = Document(files)
#循环写入element,适合纯文本
for body in sub_doc._element.body:
merged_document._element.body.append(body)
#保存新文件
merged_document.save("test/test.docx")
combine_word_documents(files)
如果哪位朋友有docx文的需求可以留消息给我,试着研究一下。