linux pdf 合并 脚本,Ubuntu中使用pdftk合并、分离PDF文档等操作

PDFtk有三个版本、一个是Free免费版、一个Pro专业版需要付费、一个是server命令行版本。使用PDFtk可以合并、拆分等操作pdf文档

系统环境

Ubuntu 20.04

安装

使用snap包管理器来安装pdftk:

$ sudo snap install pdftk

a14957a1c605d835857f867a9f203703.png

合并多个PDF

下面例子中将admin_guide.pdf started_guide.pdf user-guide.pdf三个文件合并在一起,输出文件名为:guide.pdf:

bob@ubuntu-20-04:~/test$ pdftk *.pdf cat output guide.pdf

或者

bob@ubuntu-20-04:~/test$ pdftk A=user-guide.pdf B=started_guide.pdf C=admin_guide.pdf cat A C B output Guide.pdf

使用A,B,C变量之后,可以按照自定义的顺序合并。

fa81b16fddecb79093f350733aad34ee.png

可以看到合并之后对的大小是2M。是前面三个文件合并之后的大小。

拆分PDF

使用burst参数来拆分PDF。如果需要指定切割后的每一个pdf文件名,可以添加output参数,后面跟上前缀:

bob@ubuntu-20-04:~/test$ pdftk user-guide.pdf burst output user-guide_%02d.pdf

上面output后面跟的值,%02d意思是输出2位十进制的数字。

50f91a64bd486e7f99f9a957485e4e47.png

加密pdf

为PDF添加访问密码

将user-guide.pdf文件加入访问密码admin123,并保存为encrypt-user-guide.pdf文件。

bob@ubuntu-20-04:~/test$ pdftk user-guide.pdf output encrypt-user-guide.pdf user_pw admin123

看到下图,打开encrypt-user-guide.pdf文件时需要提供密码。

d38555aa1f75dd8f2280a222772d124e.png

为PDF添加编辑密码

下面将user-guide.pdf文件添加编辑密码,密码为Admin123。输出文件为editpw-user-guide.pdf。

bob@ubuntu-20-04:~/test$ pdftk user-guide.pdf output editpw-user-guide.pdf owner_pw Admin123

8d35f8600421ef871d3e7aabd2ec9b1d.png

b808986d3b19265f8c2a86e8aa2676b2.png

为PDF添加访问密码和编辑密码

下面命令使用owner_pw和user_pw设置编辑密码和访问密码。

bob@ubuntu-20-04:~/test$ pdftk user-guide.pdf output allpw-user-guide.pdf owner_pw Admin123 user_pw admin123

使用下面的allow printing参数,可以让加密的文件支持打印。

bob@ubuntu-20-04:~/test$ pdftk user-guide.pdf output encrypt-user-guide.pdf owner_pw Admin123 allow printing

可以看到下图,不能点击打印,这是没有添加allow printing参数的状态。

1c47a6bbcb1dbcf0f3c97e116219903e.png

下面图片是添加allow printing参数的状态,不需要输入编辑密码,就可以打印:

9a3a1dc7f3ab7871230597d1471a5682.png

解密PDF

下面是解密命令,关键参数是input_pw,首先需要提供编辑的密码,也就是设置的owner_pw参数,导出为noeditpw-user-guide.pdf之后,再将noeditpw-user-guide.pdf文件解密访问密码,也就是user_pw参数,导出文件为decrypt-user-guide.pdf。解密编辑密码和访问密码都是同样的命令,但解密顺序首先是编辑密码,然后是访问密码。

bob@ubuntu-20-04:~/test$ pdftk encrypt-user-guide.pdf input_pw Admin123 output noeditpw-user-guide.pdf

bob@ubuntu-20-04:~/test$ pdftk noeditpw-user-guide.pdf input_pw admin123 output decrypt-user-guide.pdf

提取页面

提取奇数页面

使用下面命令提取出文件中的奇数页,使用的参数是1-endodd意思是从第一页到尾页选择odd(奇数页),导出为odd-started_guide.pdf文件。

bob@ubuntu-20-04:~/test$ pdftk started_guide.pdf cat 1-endodd output odd-started_guide.pdf

提取偶数页面

使用下面命令提取出文件中的偶数页,使用的参数是1-endeven意思是从第一页到尾页选择even(偶数页),导出为even-started_guide.pdf文件。

bob@ubuntu-20-04:~/test$ pdftk started_guide.pdf cat 1-endeven output even-started_guide.pdf

提取指定页面

下面命令可以提取出指定页数并另存文件。

bob@ubuntu-20-04:~/test$ pdftk started_guide.pdf cat 2 3 5 7-end output rand_page_started_guide.pdf

总结

pdftk具有强大功能,具有合并PDF文档 、分割PDF、旋转PDF页面、解密PDF密码、加密PDF等众多功能。

内容概要:本文档《gee scripts.txt》记录了利用Google Earth Engine(GEE)进行遥感影像处理与分类的脚本流程。首先,对指定区域内的Landsat 5卫星图像进行了数据筛选,排除云量超过7%的影像,并应用缩放因子调整光学波段和热波段的数值。接着,基于样本数据集训练随机森林分类器,用于区分植被、水体、建筑、土壤、拜耳作物、岩石和草地等地物类型。最后,将训练好的模型应用于处理后的Landsat 5影像,生成分类结果图层,并计算混淆矩阵以评估模型准确性,同时将分类结果导出至Google Drive。 适合人群:从事地理信息系统(GIS)、遥感科学或环境监测领域的研究人员和技术人员,特别是那些希望深入了解GEE平台及其在地物分类中的应用的人士。 使用场景及目标:①从Landsat卫星获取特定时间段内的高质量影像数据;②通过预处理步骤提高影像质量,确保后续分析的有效性;③构建并训练机器学习模型以实现地物自动分类;④评估分类模型性能,保证结果可靠性;⑤将最终成果高效存储于云端平台以便进一步研究或共享。 阅读建议:由于涉及较多专业术语和技术细节,在阅读时建议先熟悉GEE平台的基本操作以及相关遥感知识,重点关注数据处理流程和分类算法的选择依据。此外,对于代码部分,可以尝试在自己的GEE环境中运行,以便更好地理解每个步骤的具体作用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值