python处理word_利用python批量处理Word文件——正文、标题

最新推荐文章于 2024-07-19 07:51:17 发布

weixin_39974958

最新推荐文章于 2024-07-19 07:51:17 发布

阅读量670

点赞数

文章标签： python处理word

本文介绍如何使用Python的docx库处理Word文件，特别是读取和写入正文及标题。内容包括：读取Word的表格、图片、正文，其中重点讲解了根据段落样式（如'Heading 1', 'Heading 2'）读取不同级别的标题，以及如何写入标题和正文。" 122715555,98900,Delphi实现Checkbox全选、反选及全不选操作,"['Delphi', 'Windows编程', 'GUI开发']

摘要由CSDN通过智能技术生成

前面写了如何处理word中的表格：利用python批量处理Word文件——表格 ,其实我觉得word正文应该很少用到批处理，不过万一有朋友需要呢，我们要处理的文件内容千奇百怪，但我觉得难点其实是如何对我们想处理的内容进行读写，所以这篇博客的主要内容就是word文件的读写。我把word文件中的内容分为三类：一是表格；二是图片；三是其它内容。表格和图片的处理我在另外的博客中有详细说明，这里主要谈谈word正文的读写。

在docx中，Word内容的（除表格、图片）的基本组成是段落，因此word的所有内容都存储在paragraphs中，paragraph有两个属性：一是text，二是style。text存储段落的内容，style判断段落的种类。

1.读取Word内容

1.1读取Word中的表格

1.2读取Word中的图片

1.3读取Word正文

from docx import Document

doc=Document("./a.docx")

for p in doc.paragraphs:

print(p.text)

通过遍历paragraphs就可以获得word中全部内容，有时候我们并不需要读取Word中的所有内容，我们可能只想要某些特殊的内容，比如标题，比如列表，那么docx可否实现呢，答案是肯定的。

1.3.1 读取Word中的标题

一级标题

for p in doc.paragraphs:

if p.style.name=='Heading 1':

print(p.text)

二级标题

for p in doc.par

最低0.47元/天解锁文章

weixin_39974958

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。