如题所示,文献pdf首页提取,做成单独的pdf
- 主要是为了将搜集到的大量文献的摘要提取出来,通过直接阅读摘要先判断文章需不需要看下去
需要安装的库
pip install pypdf2
在基础的功能上使用tkinter 做了一个界面,方便操作,打包完成后可以直接双击使用。
"""
Created on Fri Nov 5 15:49:08 2021
@author: zy_win10
"""
import tkinter
from tkinter import filedialog
from tkinter import *
from PyPDF2 import PdfFileWriter, PdfFileReader
import os
from tkinter import messagebox
def helloCallBack():
file_path = filedialog.askdirectory()
e.set(file_path)
g_pdf()
def g_pdf():
try:
fl = os.listdir(e.get())
output = PdfFileWriter()
for item in fl:
if '.pdf' in item:
pdf_file = PdfFileReader(open(os.path.join(e.get(),item), "rb"))
output.addPage(pdf_file.getPage(0))
import time
ofn = 'output'+str(time.time())+'.pdf'
print(ofn)
outputStream = open(os.path.join(e.get(),ofn), "wb")
output.write(outputStream)
messagebox.showinfo('ok','转换完成')
except Exception as ee:
messagebox.showinfo('error','请保证pdf文件内容 名称及路径均没有中文')
top = tkinter.Tk()
top.geometry("200x100")
button2 = Button(top, text='生成pdf', command=g_pdf)
B = tkinter.Button(top, text ="选择文件夹", command = helloCallBack)
e = StringVar()
B.pack()
button2.pack()
top.mainloop()
- 代码东拼西凑的,有我之前写的一些程序,也有从网上其它博客找到的。出处可能找到不到了,如果需要引用可以告知。
生成exe
Gitee 链接 在里面可以找到生成好的exe 可以直接使用
包含生成好的exe