磐创AI分享
作者 | Huang Supreme
编辑 | 磐小仙
输
作者介绍:
大家可以叫我黄同学(博客名:Huang Supreme),一个应用统计硕士,爱好写一些技术博客,志在用通俗易懂的写作风格,帮助大家学到知识,学好知识!
【作者导语】本文是鉴于有些粉丝的工作需求,有时候需要遇到这些文件的处理。因此,我写了一个文章集合,供大家参考。全篇包括三个章节,分别为:Python使用openpyxl操作excel、python使用PyPDF2和pdfplumber操作pdf、python使用python-docx操作word。本篇为第三章节。
全文已整理为pdf,可按文末指引获取。本章目录
章节三:
python使用python-docx操作word
1、python-docx库介绍
2、Python读取Word文档内容
1)word文档结构介绍
2)python-docx提取文字和文字块儿
① python-docx提取文字
② python-docx提取文字块儿
3)利用Python向Word文档写入内容
① 添加段落
② 添加文字块儿
③ 添加一个分页
④ 添加图片
⑤ 添加表格
⑥ 提取word表格,并保存在excel中(很重要)
3、利用Python调整Word文档样式
1)修改文字字体样式
2)修改段落样式
① 对齐样式
② 行间距调整
③ 段前与段后间距
上下滚动查看更多
python使用python-docx操作word
1、python-docx库介绍
- 该模块儿可以创建、修改Word(.docx)文件;
- 此模块儿不属于python标准库,需要单独安装;
- python-docx使用官网:python-docx官网(https://python-docx.readthedocs.io/en/latest/)
- 我们在安装此模块儿使用的是pip install python-docx,但是在导入的时候是import docx;
2、Python读取Word文档内容
- 注意:每进行一个操作,必须保存一下,否则等于白做;
1)word文档结构介绍
2)python-docx提取文字和文字块儿
① python-docx提取文字
有一个这样的docx文件,我们想要提取其中的文字,应该怎么做?代码如下:
from docx
结果如下:
② python-docx提取文字块儿
from docx
结果如下:
3)利用Python向Word文档写入内容
① 添加段落
from docx
结果如下:
② 添加文字块儿
from docx
结果如下:
③ 添加一个分页
from docx
结果如下:
④ 添加图片
from docx
结果如下:
⑤ 添加表格
from docx
结果如下:
⑥ 提取word表格,并保存在excel中(很重要)
from docx
结果如下:
3、利用Python调整Word文档样式
1)修改文字字体样式
from docx
结果如下:
2)修改段落样式
① 对齐样式
from docx
结果如下:
② 行间距调整
from docx
结果如下:
③ 段前与段后间距
- 这里提供代码,自行下去检验
推荐阅读:
Python自动化办公系列之Python操作Excel
Python自动化办公系列之Python操作PDF
全文PDF获取方式:
1、扫描 下方二维码 ,关注「磐创AI」 2、后台回复关键字「 python办公 」,即可获得文章PDF以及作者博客地址
👆长按上方二维码 2 秒回复「python办公」即可获取
✄------------------------------------------------
看到这里,说明你喜欢这篇文章,请点击「在看」或顺手「转发」「点赞」。
欢迎微信搜索「panchuangxx」,添加小编磐小小仙微信,每日朋友圈更新一篇高质量推文(无广告),为您提供更多精彩内容。
▼ ▼ 扫描二维码添加小编 ▼ ▼