对 Excel , Python 有特定的包进行处理,例如 openpyxl ;处理 word 时同样有一款专业的处理库供我们使用 — python - docx(简称 docx ),可对 Microsoft Word(.docx) 文件进行基本操作
本文先介绍一下 Python-docx 常用到的基本语法,在了解语法之前,需要理解 python-docx 各命令所对应的 word 各部件,如下图所示,Document 指的是 word 文档,paragraph 对应段落、run 对应 一句话中的各个字段,做样式调整时,一般面向的操作对象都是逐字段进行的
1,安装 Python-docx
通过 pip 工具即可进行安装,在命令行中输入 pip install Python-docx
即可,见到下面页面代表已经安装成功。
2,创建或打开 Document
Python-docx 导入包时是以 docx 命令存在的,与 Opencv 的 Python 版本导入方法相似;创建文件、打开文件时 以 Document() 命令操作,这里操作时需要注意几个点:
- 1,
Document()
命令是基于默认”模板“创建一个空白文档,随后可对文档进行编辑操作; - 2,
Document(path)
命令表示打开一个本地已经存在的 docx 文件,path 表示存放目录若不存在则程序报错;
下面代码中,创建了一个空白 docx,赋值给 document
from docx import Document
document = Document()
3,加入一段落
段落作为 docx 文档正文的主要成分,那怎样在创建好的 Document 中加入一段话呢,这里有两种方式
1,在文档后面插入
这种方法是比较常见且简单的,命令如下
paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')
方法中将创建好的段落引用指向 paragraph ,表明了光标的位置,后面的一些操作可以借助 paragraph 引用变量来作为定位操作
2,在指定地方的前面插入
文档编辑正常顺序是在末尾进行编辑ÿ