http转https_实战代码 | 各类文件批量转PDF

最新推荐文章于 2024-08-31 11:21:34 发布

weixin_39663258

最新推荐文章于 2024-08-31 11:21:34 发布

阅读量98

点赞数

文章标签： http转https plt文件转pdf文件 poi doc转docx python docx转pdf tif文件转pdf xps文件转pdf

python的大名想必各位都在微信公众号，短视频广告各个地方的宣传下洗了脑了，但是学习无从学起，内容太多，太枯燥。

本模板旨在分享和解读完整代码，只要你有安装配置好python环境，在pycharm里安装相应的第三方文件库，黏贴代码即可运行，我们以实用型为目的学习。编程类学习，从模仿中掌握突破。需要python教学视频和资料的在公众号菜单栏获取，有任何问题欢迎公众号后台联系我或加我微信。

注：import后导入的模块需要单独安装，有些是自带的，但是要实现更复杂的功能一般是安装第三方模块。安装方法：

1.win+r，调出命令提示窗口，输入cmd再按回车键。
2.输入安装指令(电脑要联网，推荐使用国内镜像网站，安装更快，不然很慢)

Python pip安装第三方库的国内镜像

Windows系统下，一般情况下使用pip在DOS界面安装python第三方库时，经常会遇到超时的问题，导致第三方库无法顺利安装，此时就需要国内镜像源的帮助了。

使用方法如下：

例如：pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xxx(这里的xxx是模块名)，这样就会从清华这边的镜像去安装pyspider库。

国内源：

清华：https://pypi.tuna.tsinghua.edu.cn/simple

阿里云：http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学：http://pypi.hustunique.com/

山东理工大学：http://pypi.sdutlinux.org/

豆瓣：http://pypi.douban.com/simple/

note：新版ubuntu要求使用https源，要注意。

模块的安装

今天分享用python批量对常见文件转换为pdf格式的办法，今天调用的模块是win32com。

首先是安装办法：命令提示符窗口输入：(我直接使用清华的镜像网站，更快一点。)

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pywin32

模块使用简介

win32com 模块主要为 Python 提供调用 windows 底层组件对 word 、Excel、PPT 等进行操作的功能，只能在 Windows 环境下使用，并且需要安装 office 相关软件才行(WPS也行)。

使用 win32com 模块主要是因为 Python 针对 word 文档操作的第三方库相对较少并且功能较弱，Python 有针对 .docx 后缀文件的第三方库如 python-docx、pydocx等等，但是没有针对 .doc 和 .wps 的第三方库，所以这里就只能使用 win32com 模块。相对而言 Python 针对 Excel文档操作的第三方库就非常友好

开始战斗

from win32com.client import gencachefrom win32com.client import constants, gencacheimport os#创建PDFdef createPdf(wordPath, pdfPath):    """    word转pdf    :param wordPath: word文件路径    :param pdfPath:  生成pdf文件路径    """    word = gencache.EnsureDispatch('Word.Application')    doc = word.Documents.Open(wordPath, ReadOnly=1)    doc.ExportAsFixedFormat(pdfPath,                            constants.wdExportFormatPDF,                            Item=constants.wdExportDocumentWithMarkup,                            CreateBookmarks=constants.wdExportCreateHeadingBookmarks)    word.Quit(constants.wdDoNotSaveChanges)#遍历当前目录，并把Word文件转换为PDFdef wordToPdf():    print("转换中...")    # 获取当前运行路径    path = os.getcwd()    # 获取所有文件名的列表    filename_list = os.listdir(path)    # 获取所有word文件名列表    wordname_list = [filename for filename in filename_list \                        if filename.endswith((".doc", ".docx"))]    for wordname in wordname_list:        # 分离word文件名称和后缀，转化为pdf名称        pdfname = os.path.splitext(wordname)[0] + '.pdf'        # 如果当前word文件对应的pdf文件存在，则不转化        if pdfname in filename_list:            continue        # 拼接 路径和文件名        wordpath = os.path.join(path, wordname)        pdfpath = os.path.join(path, pdfname)        createPdf(wordpath,pdfpath)#word转pdfif __name__ == '__main__':    wordToPdf()

开始战斗

1.将以上代码复制，创建一个py文件。

2.将批量转换的py脚本和需要转换的word文件置于一个文件夹内，然后运行文件等待结果即可。

效果图如下：