用 python 读取 pdf 并生成新的 work 文件

jory1002

于 2023-08-21 11:09:19 发布

阅读量105

点赞数

文章标签： pdf python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jory1002/article/details/132404405

版权

步骤：

安装 PyPDF2 库。
使用 PyPDF2 库打开 PDF 文件。
使用 PyPDF2 库读取 PDF 文件中的文本。
使用 PyPDF2 库读取 PDF 文件中的图像。
创建一个新的 Word 文档。
将 PDF 文件中的文本和图像添加到新的 Word 文档中。
保存新的 Word 文件。

以下是使用 PyPDF2 库从 PDF 文件中读取文本和图像并生成新的 Word 文件的示例代码：

import PyPDF2

# 打开 PDF 文件
pdf = PyPDF2.PdfFileReader("my_pdf.pdf")

# 读取 PDF 文件中的文本
text = pdf.getPage(0).extractText()

# 读取 PDF 文件中的图像
images = pdf.getPage(0).getImages()

# 创建一个新的 Word 文档
word = Document()

# 将 PDF 文件中的文本和图像添加到新的 Word 文档中
word.add_paragraph(text)
for image in images:
  word.add_picture(image)

# 保存新的 Word 文档
word.save("my_word_document.docx")

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
用 python 读取 pdf 并生成新的 work 文件

【代码】用 python 读取 pdf 并生成新的 work 文件。
复制链接

扫一扫

jory1002 CSDN认证博客专家 CSDN认证企业博客

码龄3年

21: 原创

145万+: 周排名

8万+: 总排名

6453: 访问

: 等级

276: 积分

52: 粉丝

64: 获赞

10: 评论

53: 收藏

私信

关注

热门文章

分类专栏

日常 8篇
开发 7篇
git 1篇

最新评论

python 发送邮件
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
fastapi+mongodb一个简化的CRUD示例
CSDN-Ada助手: 恭喜作者发布了第20篇博客，“fastapi+mongodb一个简化的CRUD示例”，看来你真的是创作不断呢！希望你能继续保持这样的创作热情，不断学习探索新的技术和主题。或许下一步可以考虑分享一些实际项目中的应用经验，或者深入探讨某个技术的核心原理，相信读者们会非常期待的！加油！
Pycharm 私人定制
CSDN-Ada助手: 恭喜您发布了第19篇博客《Pycharm 私人定制》，看来您对于Pycharm的定制化应用已经有了深入的了解和实践。希望您能继续保持创作的热情和耐心，相信您的经验分享会对更多的读者有所帮助。在下一篇博客中，或许可以探讨一下Pycharm的高级功能或者与其他IDE的比较，这样可以让读者更全面地了解Pycharm的优势所在。期待您的下一篇作品！
Python项目依赖管理最佳实践
CSDN-Ada助手: 恭喜您发布了第18篇博客，标题为“Python项目依赖管理最佳实践”！非常感谢您分享这么有用的内容。接下来，我建议您可以探讨一下Python项目中的性能优化技巧，或者分享一些实用的调试技巧，这样能够帮助更多的读者解决实际问题。期待您的下一篇博客！
Python项目依赖管理最佳实践
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。