Python获取docx文档里的批注

最新推荐文章于 2025-03-27 15:39:00 发布

BuXianShan

最新推荐文章于 2025-03-27 15:39:00 发布

阅读量4.1k

点赞数 1

分类专栏： python 文章标签： python-docx docx批注

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43479622/article/details/90580630

版权

注意：该作者博客已迁移至https://buxianshan.xyz

使用Python-docx库可以很方便的处理docx文件（官方文档）

但是有些隐含的信息Python-docx库好像无法读取，比如docx文档里的批注

下面介绍一种用python获取docx文档批注的方法

首先区分doc文件和docx文件

以前Office产品中Word用.doc文件格式，这种二进制格式很难与其他软件兼容。docx是Microsoft Office2007之后版本使用的，用新的基于XML的压缩文件格式取代了以前默认文件格式，在传统的文件名扩展名后面添加了字母“x”（即“.docx”取代“.doc”、“.xlsx”取代“.xls”、“.pptx”取代“.ppt”）。

docx格式的文件本质上是一个ZIP文件。将一个docx文件的后缀改为ZIP后是可以用解压工具打开或是解压的。事实上，Word2007的基本文件就是ZIP格式的，他可以算作是docx文件的容器。

比如有一个test.docx文件

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。