python实现PDF转图片的简单粗暴处理办法

最新推荐文章于 2024-08-16 00:19:00 发布

HWorDW

最新推荐文章于 2024-08-16 00:19:00 发布

阅读量443

点赞数

文章标签： python

本文链接：https://blog.csdn.net/m0_46762711/article/details/111602894

版权

python实现PDF转图片的简单粗暴处理办法

# -*- coding:utf-8 -*-
'''
_AUTHOR_='QXY'
_MTIME_='2020/12/24'
'''
from win32com import client
import os

if __name__ == '__main__':
    path = r"C:\Users\user_Guest\Desktop\ky2020"	#pdf文件所在目录
    word = client.Dispatch('Word.Application')
    for pdf in os.listdir(path):	#批量处理该目录下的所有文件
        doc = word.Documents.Open(path + "\\" + pdf)
        doc.SaveAs(path + '\\' + pdf[:-4]+'.html', 8)  # 数字对应下方注释中的文件类型代码
        doc.Close()
    word.Quit()
'''
wdFormatDocument = 0
wdFormatDocument97 = 0
wdFormatDocumentDefault = 16
wdFormatDOSText = 4
wdFormatDOSTextLineBreaks = 5
wdFormatEncodedText = 7
wdFormatFilteredHTML = 10
wdFormatFlatXML = 19
wdFormatFlatXMLMacroEnabled = 20
wdFormatFlatXMLTemplate = 21
wdFormatFlatXMLTemplateMacroEnabled = 22
wdFormatHTML = 8
wdFormatPDF = 17
wdFormatRTF = 6
wdFormatTemplate = 1
wdFormatTemplate97 = 1
wdFormatText = 2
wdFormatTextLineBreaks = 3
wdFormatUnicodeText = 7
wdFormatWebArchive = 9
wdFormatXML = 11
wdFormatXMLDocument = 12
wdFormatXMLDocumentMacroEnabled = 13
wdFormatXMLTemplate = 14
wdFormatXMLTemplateMacroEnabled = 15
wdFormatXPS = 18
'''