Python批量处理Word文档(.doc/.docx)——批量获取文档标题并以标题重命名文件

本文介绍如何使用Python脚本doc2docx.py、getparagraphs.py和getdoctitleAndrename.py批量处理Word文档,首先将.doc转换为.docx,然后获取文档标题并据此重命名文件,适用于大量文档的自动化处理。
摘要由CSDN通过智能技术生成

Python处理Word文档(.doc/.docx)——批量获取文档标题并以标题重命名文件

由于工作需要处理一批.doc文档,并且需要核对每个文档的标题,以标题重命名文件,之后将word文档批量转换成pdf。人工完成这些内容再文档数量庞大的情况下耗时耗力,于是写了几个脚本来处理。

需要安装python-docx,pywin32库。

doc2docx.py

Python有专门读取.docx的模块python_docx(只能读取.docx文件,不能读取.doc文件),因为只能处理docx文件,所以需要将doc转换成docx格式(直接修改文件后缀名是无效的呃。)

import os
from docx import Document 
from docx.shared import Inches
from win32com import client as wc
word = wc.Dispatch("Word.Application")

ul=r"D:\\docs\\sec-report\\test" #需要处理的文件所在文件夹目录
filenamelist=os.listdir(ul)
for y in xrange(len(filenamelist)): #for循环处理整个目录下的文件
    doc = word.Documents.Open(ul+
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值