http转https_实战代码 | 各类文件批量转PDF

d540f1248b8d86c1bb8140ed368b083f.png

python的大名想必各位都在微信公众号,短视频广告各个地方的宣传下洗了脑了,但是学习无从学起,内容太多,太枯燥。

本模板旨在分享和解读完整代码,只要你有安装配置好python环境,在pycharm里安装相应的第三方文件库,黏贴代码即可运行,我们以实用型为目的学习。编程类学习,从模仿中掌握突破。需要python教学视频和资料的在公众号菜单栏获取,有任何问题欢迎公众号后台联系我或加我微信。

注:import后导入的模块需要单独安装,有些是自带的,但是要实现更复杂的功能一般是安装第三方模块。安装方法:

1.win+r,调出命令提示窗口,输入cmd再按回车键。
2.输入安装指令(电脑要联网,推荐使用国内镜像网站,安装更快,不然很慢)

Python pip安装第三方库的国内镜像

Windows系统下,一般情况下使用pip在DOS界面安装python第三方库时,经常会遇到超时的问题,导致第三方库无法顺利安装,此时就需要国内镜像源的帮助了。

使用方法如下:

例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xxx(这里的xxx是模块名),这样就会从清华这边的镜像去安装pyspider库。

国内源:

清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学:http://pypi.hustunique.com/

山东理工大学:http://pypi.sdutlinux.org/ 

豆瓣:http://pypi.douban.com/simple/

note:新版ubuntu要求使用https源,要注意。

64b59b65bfee33006b5ecc358b6e4c15.png

模块的安装

今天分享用python批量对常见文件转换为pdf格式的办法,今天调用的模块是win32com。

首先是安装办法:命令提示符窗口输入:(我直接使用清华的镜像网站,更快一点。)

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pywin32

818ea605cd72b89573025b680109d6db.png

模块使用简介

win32com 模块主要为 Python 提供调用 windows 底层组件对 word 、Excel、PPT 等进行操作的功能,只能在 Windows 环境下使用,并且需要安装 office 相关软件才行(WPS也行)。

使用 win32com 模块主要是因为 Python 针对 word 文档操作的第三方库相对较少并且功能较弱,Python 有针对 .docx 后缀文件的第三方库如 python-docx、pydocx等等,但是没有针对 .doc 和 .wps 的第三方库,所以这里就只能使用 win32com 模块。 相对而言 Python 针对 Excel文档操作的第三方库就非常友好

开始战斗

from win32com.client import gencachefrom win32com.client import constants, gencacheimport os#创建PDFdef createPdf(wordPath, pdfPath):    """    word转pdf    :param wordPath: word文件路径    :param pdfPath:  生成pdf文件路径    """    word = gencache.EnsureDispatch('Word.Application')    doc = word.Documents.Open(wordPath, ReadOnly=1)    doc.ExportAsFixedFormat(pdfPath,                            constants.wdExportFormatPDF,                            Item=constants.wdExportDocumentWithMarkup,                            CreateBookmarks=constants.wdExportCreateHeadingBookmarks)    word.Quit(constants.wdDoNotSaveChanges)#遍历当前目录,并把Word文件转换为PDFdef wordToPdf():    print("转换中...")    # 获取当前运行路径    path = os.getcwd()    # 获取所有文件名的列表    filename_list = os.listdir(path)    # 获取所有word文件名列表    wordname_list = [filename for filename in filename_list \                        if filename.endswith((".doc", ".docx"))]    for wordname in wordname_list:        # 分离word文件名称和后缀,转化为pdf名称        pdfname = os.path.splitext(wordname)[0] + '.pdf'        # 如果当前word文件对应的pdf文件存在,则不转化        if pdfname in filename_list:            continue        # 拼接 路径和文件名        wordpath = os.path.join(path, wordname)        pdfpath = os.path.join(path, pdfname)        createPdf(wordpath,pdfpath)#word转pdfif __name__ == '__main__':    wordToPdf()

开始战斗

1.将以上代码复制,创建一个py文件。

2.将批量转换的py脚本和需要转换的word文件置于一个文件夹内,然后运行文件等待结果即可。

效果图如下:

a45cebaa4f32213cff84c50b70aed2e1.png

99c886c49dda8186104aa70ce56e5d5e.png

64b59b65bfee33006b5ecc358b6e4c15.png

okok,今天的分享到此结束,欢迎各位三连c8134617544822064003012894ece404.pngc8134617544822064003012894ece404.pngc8134617544822064003012894ece404.png。长按下方图片关注公众号。

29fd5385f08e289ea5f698bf98d614f6.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值