批量删除PDF注释

         帖子参考http://blog.csdn.net/xiazhaoqiang/archive/2011/02/28/6212524.aspx,感觉原贴步骤写的不全,所以在此完善一下

 

在查看如电子书等pdf文档时,一般都喜欢在上面加些标记或注释,但有时需要将文档还原到原有状态。此时可以通过单个删除的方法(当注释较少时),也可以通过下面的方法删除整个pdf文档中的所有标记及注释:

 

1. 打开“Adobe Acrobat 8 Professional”,选择“高级”->“文档处理”->“批处理...”;

2. 出现“批处理序列”对话框,点击“新建序列...”按钮;

3. 在弹出的对话框中输入一个名称(这里输入“删除所有注释”);

4. 出现“编辑批处理顺序”对话框,点击“选择命令...”按钮,出现“编辑序列”对话框,拉动滚动条到最下面,选择“删除所有注释”并单击右侧的“添加”按钮;

 

OK,此时前期工作已经做完,也就是说你已经为Adobe Acrobat创建了一条批处理,下面就可以通过刚才创建的批处理执行删除注释的操作了:

 

5. 在“批处理序列”对话框中,选择“删除所有注释”,然后单击“运行序列”按钮,在弹出的确认对话框中单击“确定”;

6. 选择需要删除注释的pdf文档。

 

此时,再打开你的pdf文档,里面的注释是不是已经全部被清除了.

^-^

 

下面是附图:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
万兴PDF编辑器是一个非常容易使用的PDF编辑工具。在万兴PDF编辑器的帮助下,您可以添加、删除、剪切、复制、粘贴、编辑、编辑图片和许多其他操作到现有的PDF文档中。您还可以从各种格式的文档中创建PDF,如word、excel、ppt、图片、txt等。不仅如此,您还可以将PDF转换成可编辑的文档格式,并且还可以将各种文档合并成一个PDF文档。该软件功能非常全面,也非常容易使用。 软件截图: 软件功能: PDF文件编辑。打开PDF文档并打开PDF编辑模式,以修改PDF文档的文本并更改字体、字号和颜色。编辑图像和其他对象,随意拖动或移动要编辑的对象,自由添加和调整图像的大小,选择图像的位置,剪辑图像,多图片对齐等。 PDF格式转换。它支持将一个或多个PDF文件转换成各种其他格式的文件。转换后的文件质量很高,包括Powerpoint、Word、Excel、HTML、JPEG、TXT、RTF等格式。 PDF图片转文字。通过光学字符识别(也称为OCR识别),图像或打印文本可以转换为机器可读文本,识别精度高于同行。 PDF文件签名。对于所有需要签名的文档,数字签名比纸质签名更方便,可以有效保护文档安全。 PDF文档数据提取。在处理电子发票等格式相同的电子单据时,只要选择要提取的区域,所有单据中的区域数据都可以批量导出。 软件特色: 创建一个可填写的PDF表格 只需单击一下,任何在Word、Excel或其他Office应用程序中生成的现有平面表单都可以转换为可填充的可编辑PDFPDF格式转换 拖放鼠标,将PDF格式转换为PPT、Word、Excel、HTML、JPEG、PNG和其他格式。可以批量处理500多份文件。 文档注释注释 在您想要的任何地方添加注释和文本框。用高亮、叉号和下划线标记文档以供审阅。 文档拆分和提取 将一个多页的PDF文档分成几个较小的文件,或者从文档中提取一个指定的页面来生成一个单独的PDF文档。 添加贝茨代码 为文档添加可定制的贝茨数字,以便于索引和检索。 表单自动识别数据提取 智能表单自动化技术可以在几秒钟内将数百个相同表单的PDF表单数据提取到一个可编辑的Excel表单中。 添加水印、背景、页眉和页脚 轻松添加和删除文本和图片水印、背景、页眉和页脚,允许您完全自定义创建的PDF文件。 密码和密文保护 使用高度机密的256位AES加密密码保护PDF文件,并设置锁定特定功能,如查看、打印、编辑、填充和旋转。
要使用Python进行批量处理PDF文件,可以使用for循环进行批量操作。首先,将PDF文件转化为txt文件,可以使用pdf_to_txt函数,并传入文件路径作为参数。然后,删除txt文件中的换行符,以防止词语因此被拆分。可以使用delete_huanhangfu函数来实现。接下来,可以添加自定义词语,使用word_by_myself函数来完成。最后,分词并进行词频统计,可以使用cut_and_count函数,传入文件路径作为参数。下面是一个示例代码: ``` import os def pdf_to_txt(filepath, index): # 实现将pdf文件转化为txt文件的操作 pass def delete_huanhangfu(filepath, index): # 实现对txt文件的换行符进行删除的操作 pass def word_by_myself(): # 添加自定义词语的操作 pass def cut_and_count(filepath): # 实现分词并进行词频统计的操作 pass if __name__ == "__main__": # 批量处理pdf文件 fileNum = 10 # 假设总共有10个pdf文件 path = 'dealPdf' for i in range(1, fileNum+1): pdf_filepath = os.path.join(path, f'{i}.pdf') pdf_to_txt(pdf_filepath, i) txt_filepath = os.path.join('dealTxt', f'{i}.txt') delete_huanhangfu(txt_filepath, i) word_by_myself() print(f'----------result {i}----------') outPutTxt_filepath = os.path.join('outPutTxt', f'{i}.txt') cut_and_count(outPutTxt_filepath) ``` 在这个示例代码中,首先定义了一些函数,如pdf_to_txt、delete_huanhangfu、word_by_myself和cut_and_count,分别负责将pdf转化为txt、删除换行符、添加自定义词语以及进行分词和词频统计的操作。然后,在主函数内使用for循环,遍历所有的pdf文件,并依次调用这些函数来进行批量处理。注意,文件名被命名为数字是为了方便处理,如果文件名已经命名完成,则在主函数内将rename函数注释掉即可。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [python批量处理PDF文档,输出自定义关键词的出现次数](https://blog.csdn.net/weixin_43956523/article/details/124217368)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值