python自动化_Python自动化办公系列之Python操作Word

8b202b374d45c20312b3517b991a142a.png

  磐创AI分享  

作者 | Huang Supreme

编辑 | 磐小仙

作者介绍:

大家可以叫我黄同学(博客名:Huang Supreme),一个应用统计硕士,爱好写一些技术博客,志在用通俗易懂的写作风格,帮助大家学到知识,学好知识!

【作者导语】本文是鉴于有些粉丝的工作需求,有时候需要遇到这些文件的处理。因此,我写了一个文章集合,供大家参考。全篇包括三个章节,分别为:Python使用openpyxl操作excelpython使用PyPDF2和pdfplumber操作pdfpython使用python-docx操作word。本篇为第三章节。
全文已整理为pdf,可按文末指引获取。

本章目录

章节三:

python使用python-docx操作word    

1、python-docx库介绍     

2、Python读取Word文档内容        

   1)word文档结构介绍        

   2)python-docx提取文字和文字块儿 

       ① python-docx提取文字          

       ② python-docx提取文字块儿        

   3)利用Python向Word文档写入内容 

       ① 添加段落          

       ② 添加文字块儿          

       ③ 添加一个分页          

       ④ 添加图片          

       ⑤ 添加表格          

       ⑥ 提取word表格,并保存在excel中(很重要)     

3、利用Python调整Word文档样式        

   1)修改文字字体样式        

   2)修改段落样式          

       ① 对齐样式          

       ② 行间距调整          

       ③ 段前与段后间距

上下滚动查看更多

python使用python-docx操作word

1、python-docx库介绍
  • 该模块儿可以创建、修改Word(.docx)文件;
  • 此模块儿不属于python标准库,需要单独安装;
  • python-docx使用官网:python-docx官网(https://python-docx.readthedocs.io/en/latest/)
  • 我们在安装此模块儿使用的是pip install python-docx,但是在导入的时候是import docx;
2、Python读取Word文档内容
  • 注意:每进行一个操作,必须保存一下,否则等于白做;
1)word文档结构介绍
a1727325d67a11b8ac0cb53de5f29554.png
2)python-docx提取文字和文字块儿
① python-docx提取文字

有一个这样的docx文件,我们想要提取其中的文字,应该怎么做?32e9369b9c157a7157264eec7533b115.png代码如下:

from docx 

结果如下:8c5e86d5da51cd2f26c4f6e92886f81f.png

② python-docx提取文字块儿
from docx 

结果如下:deefa302012b5f4c5a1fa6e8bd16fa83.png

3)利用Python向Word文档写入内容
① 添加段落
from docx 

结果如下:e92c08586ab93320de4a94625a7b9682.png

② 添加文字块儿
from docx 

结果如下:fb63556ff87252df12ff9a7eec22aaa2.png

③ 添加一个分页
from docx 

结果如下:5b936ebbe0cd06b939a4386cd510677c.png

④ 添加图片
from docx 

结果如下:f848b59deeddafe77d5e6e0e25a25122.png

⑤ 添加表格
from docx 

结果如下:b7528e6206841068ff4b7a541004c88b.png

⑥ 提取word表格,并保存在excel中(很重要)
from docx 

结果如下:3324db543260917180d267e2a94585fa.png

3、利用Python调整Word文档样式
1)修改文字字体样式
from docx 

结果如下:91c68aae912c8b69079dfa61981445ab.png

2)修改段落样式
① 对齐样式
from docx 

结果如下:1cb3d34bac0c04d5ad39f67492b8f8cd.png

② 行间距调整
from docx 

结果如下:0ef3e5a44627e0c45154d7734fe9bd7f.png

③ 段前与段后间距
  • 这里提供代码,自行下去检验
2006f6bc467d5bb1b98b514de02a883d.png

a3bf7b5cb22142f1398c54dce94692fd.gif  推荐阅读:

Python自动化办公系列之Python操作Excel
Python自动化办公系列之Python操作PDF

ffcf702f6de44d6bbd57ae04e05ceb0f.gif

全文PDF获取方式:

1、扫描 下方二维码 ,关注磐创AI 2、后台回复关键字「 python办公 」,即可获得文章PDF以及作者博客地址

3e823e0fae084ff5071da4d3dc7c3837.png

👆长按上方二维码 2 秒回复「python办公」即可获取

7ff717bb303b06cb1519d27d8b051fe1.png

✄------------------------------------------------

看到这里,说明你喜欢这篇文章,请点击「在看」或顺手「转发」「点赞」。

欢迎微信搜索「panchuangxx」,添加小编磐小小仙微信,每日朋友圈更新一篇高质量推文(无广告),为您提供更多精彩内容。

▼  ▼   扫描二维码添加小编  ▼  ▼  

3c37cadd2695328cac93671065afff6e.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值