python-docx 中超链接的读取、修改与删除

18 篇文章 17 订阅 ¥49.90 ¥99.00
本文档介绍了如何使用python-docx进行超链接的读取、删除和替换。通过docx.part.rels读取超链接,但需要过滤干扰项;删除超链接方法包括复制内容并去除链接,以及遍历paragraphs和runs;替换超链接则涉及查找http字样链接并替换为指定网址。
摘要由CSDN通过智能技术生成

前言

今天我们需要通过 python-docx 完整的操作包括:超链接的读取、插入、更新、删除。

一、文档超链接操作实例

1、读取文档中所有的超链接

(1)通过 python-docx 实现超链接的读取

这里我们需要使用到 docx.part.rels 这个属性,后面我对这个进行仔细讲解吧。这里需要注意的是,虽然可以读出所有的超链接,但是会存在很多干扰项,它会把和文档有关联的所有链接都取出来。比如我处理的文档,取出来了如下干扰项,我们只需要自己过滤一下就可以了:

关于过滤干扰项,可以提供几个思路,当然也不止这么几种思路:
1、判断返回的连接中是否包括http或https字样,如果包含的话就是我们要的超链接。
2、判断返回的文本中是否包含xml或其它非网页链接字样,如果包括则排除。

'theme/theme1.xml',
'webSet
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

布啦啦李

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值