python-docx库读写word文档

本文详细介绍了使用python-docx库进行Word文档的读写操作。包括读取文档内容,如纯文字、表格,以及写入文档内容,如添加标题、段落、表格和图片。python-docx提供了一种轻量级的方式来实现Word文档的自动化处理。
摘要由CSDN通过智能技术生成

python-docx库读写word文档

一、简介

python-docx是利用python来读写word文件的第三方库。

  • 开源地址是:https://github.com/python-openxml/python-docx
  • 官方教程:https://python-docx.readthedocs.io/en/latest/
  • 安装:pip install python-docx

python-docx库读写word文档主要涉及三个结构对象,层层递进。

Document:文档对象

from docx import Document
doc = Document('./test1.docx')   # 打开当前路径下的已有文档
doc = Document()      # 新建一个空白文档

Paragraph:段落对象

文档中的每一段内容,以换行符结尾。

Run:文字块对象

每个Paragraph中的不同部分,叫Run。注意:颜色、字体、粗细、斜体不同,就是不同的文字块。

在这里插入图片描述

二、读取word文档内容

利用python-docx库来读取现有的word文档数据,思路是先逐层获取对象,再提取相应对象的text属性。

1.读取纯文字docx文档。

在这里插入图片描述

for paragraph in doc.paragraphs:
    print(f'paragraph.text = {
     paragraph.text}')
    for run in paragraph.runs:
        print(f'\trun.text = {
     run.text}')
# output
paragraph.text = 你好,这是第一个测试python-docx库的文档。
	run.text = 你好,这是第一个测试python-docx库的文档。
paragraph.text = 这是第二段落
	run.text = 这是第二段落
paragraph.text = 这是第三段落,粗体、红色
	run.text = 这是第三段落,
	run.text = 粗体
	run.
  • 9
    点赞
  • 108
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值