python分解word文档为多个_用python批量处理word文档

本文介绍了一个Python脚本,用于批量处理Word文档,包括分解、筛选、修订和合并。脚本根据需求读取原始Word文档,生成排序后的文档清单,筛选满足条件的文档,修订内容并合并成新的文档。关键操作涉及正则表达式、datetime模块和docx模块,还实现了简单的GUI。
摘要由CSDN通过智能技术生成

应我家领导要求,开发一个word文档批处理脚本,涉及word文档、excel表格、文件存取、排序与索引、简单GUI等内容,前期针对各分项功能实现写了几篇小文章,现在将总体思路记录一下,作为这个系列的完结篇。

由于针对目标文档进行了很多特定操作,源代码本身不具备通用性,下面主要精讲其中的关键部分。完整代码、示例文档详见:

开发需求:

素材为批量word文档集(docx):位于original文件夹中。文件名为“N.xxxx.docx”(N为数字、xxxx为文档标题)。(见附图)

文件内容为各类新闻报道,排版为标题、正文内容(包括图片)、签名尾行(署名+日期)。(见附图)

需实现的功能包括:建立文档清单,清单内容包括序号、署名、日期、标题。

排序文档清单,署名+日期联合排序,署名按照指定的排序规则表排序(见附图)。

筛选文档,从清单中筛选满足特定要求(比如日期范围)的文档,生成筛选后的清单,并从原始文档集中提取这些文档。

修订文档,将文档重新排版(标题行+空一行+正文段落+签名尾行+空两行),并校订文档中的标点错误(英文标点误用、省略号不准确等)。

合并文档,将筛选、修订后的文档合并为一个统一的文档,保持各子文档的排版格式不变。

图形界面,正逢领导生日,所以除了好用,还要好看,传送门在此࿱

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值