前情提要
单位要写交流报告,上交材料要公文格式,但是打印出来要打印在A5纸张上,为了快速将公文格式转为可打印在A5纸张上的格式,使用python-docx库实现。
项目目标
通过项目,可批量实现以下功能:
- 修改纸张大小
- 修改页边距
- 修改文字大小
- 修改段落行距
- 删除不需要的问题
所需库
- lxml(处理文件的必备库)
- python-docx(docx文件处理)
- win32com(将doc自动另存为docx)
- re(判断文件类型)
- os(批量读取处理文件)
核心功能(docx库的文件处理)
#导入所需库
#导入Document用以打开docx文件
from docx import Document as dc
#导入qn进行文字的样式处理
from docx.oxml.ns import qn
#导入Pt、Cm、Inches等计量单位对应磅、厘米、英寸
from docx.shared import Pt,Cm,Inches
#定义删除文字段落函数
def delete_pg(pg):
p = pg._element
p.getparent().remove(p)
pg._p = pg._element