python替换pdf内容_如何使用python替换/删除pdf中的文本？

最新推荐文章于 2022-11-20 13:56:57 发布

weixin_39887577

最新推荐文章于 2022-11-20 13:56:57 发布

阅读量3.5k

点赞数 1

文章标签： python替换pdf内容

这样的事情有可能吗？是的，尽管不推荐。在我看来，最好的办法是打开并阅读现有的文件，将其移到可编辑的格式，删除任何你不希望出现的文本，然后将其转换回原处。在

但是，您可以使用以下方法提取数据并将其从内存中删除：import PyPDF2

# creating a pdf file object

pdfFileObj = open('example.pdf', 'rb')

# creating a pdf reader object

pdfReader = PyPDF2.PdfFileReader(pdfFileObj)

# printing number of pages in pdf file

print(pdfReader.numPages)

# creating a page object

pageObj = pdfReader.getPage(0)

# extracting text from page

print(pageObj.extractText())

# closing the pdf file object

pdfFileObj.close()

该程序将逐行：

pdfFileObj = open('example.pdf', 'rb')

打开example.pdf，并将file对象另存为pdfFileObj。在

pdfReader = PyPDF2.PdfFileReader(pdfFileObj)

创建一个PdfFileReader的对象，并将PDF file对象整个传递给一个PDF阅读器对象。在

print(pdfReader.numPages)

给出页数。在

pageObj = pdfReader.getPage(0)

创建PageObject类的对象。PDF reader对象具有函数getPage()，该函数以页码(起始形式索引0)为参数并返回page对象。在

print(pageObj.extractText())

从PDF页面中提取文本。在

pdfFileObj.close()

关闭PDF文件对象。在

替换文本只需为“”，因为您希望删除某段文本的所有实例/事例。在

weixin_39887577

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python替换pdf内容_如何使用python替换/删除pdf中的文本？

这样的事情有可能吗？是的，尽管不推荐。在我看来，最好的办法是打开并阅读现有的文件，将其移到可编辑的格式，删除任何你不希望出现的文本，然后将其转换回原处。在但是，您可以使用以下方法提取数据并将其从内存中删除：import PyPDF2# creating a pdf file objectpdfFileObj = open('example.pdf', 'rb')# creating a pdf r...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。