pdf2ppt
使用python快速轻便的将pdf转换成ppt文件
引用https://github.com/phasedOut/pdf2pptx 做的jpg合并成ppt
引用https://www.cnblogs.com/loveprogramme/p/11247037.html 做的pdf切割成jpg
github地址:https://github.com/Derekchen147/pdf2ppt
目录
- jpgs:保存分割出来的jpg
- result:保存最终生成的ppt
- source_files:保存想要转变成ppt格式的pdf(会历遍这个文件夹里面所有的pdf,要改几个放几个)
- requirements.txt:保存运行需要的包
使用方法
将requirements.txt里面的包都下载下来,可以用
pip install -r requirements.txt -i https://pypi.douban.com/simple
下载全部
把想要改成ppt的pdf都放到source_files里面,然后直接
python pdf2ppt.py
代码
代码分为两部分
一部分将source_files文件夹中的每一个pdf文件每一个切分成jpg并保存在jpgs文件夹里面
另一部分将jpgs文件夹里面的jpg图片读取出来并合并成ppt
import fitz
import os
import time
from tqdm import tqdm
import os
import datetime
from PIL import Image
from pptx import Presentation
from pptx.util import Inches, Pt
for filename in os.listdir('source_files/'):
# 将pdf一张张切割成jpg
timestamp = time.time()
print('切割pdf为jpg...')
full_path = "./source_files/%s" % filename # 拼接,得到PDF文件的绝对路径
print(full_path)
doc = fitz.open(full_path) # 打开一个PDF文件,doc为Document类型,是一个包含每一页PDF文件的列表
rotate =