学位论文查重在论文写作要求中有着重要的地位。
目前一些官方查重平台提供了网络内容查重的功能,如果学生论文内容泄露并出现在网络平台上。极其容易会使得该名学生的学位论文重复率大幅上升导致延毕。
本文的内容旨在使用Python语言对PDF文件进行加密,来限制对内容的复制来一定程度上防止内容的泄露。但是目前OCR等光学字符识别的技术发展快速,即使进行了加密依旧有很高的泄露风险。同学们还是要注意安全。
from PyPDF2 import PdfReader, PdfWriter
# 打开原始PDF文件
reader = PdfReader("F:\\论文PDF.pdf")
writer = PdfWriter()
# 将页面添加到写入器对象
for page in reader.pages:
writer.add_page(page)
# 设置禁止复制的权限
writer.add_metadata({
"/Author": "Author Name",
"/Title": "Document Title",
"/Subject": "Document Subject",
"/Producer": "Producer",
"/Creator": "Creator"
})
writer.encrypt(user_password="1234", owner_password="4321", permissions_flag=4)
# 保存新的PDF文件
with open("F:\\论文PDF_protected.pdf", "wb") as f:
writer.write(f)
上面的代码使用 PyPDF2这个库对pdf文件进行加密。
设置了两个角色的密码user与owner。 owner享有所有权限,而user则被限制
密码自己可设置,只需要替换代码中的 1234 和 4321就可以