python的大名想必各位都在微信公众号,短视频广告各个地方的宣传下洗了脑了,但是学习无从学起,内容太多,太枯燥。
本模板旨在分享和解读完整代码,只要你有安装配置好python环境,在pycharm里安装相应的第三方文件库,黏贴代码即可运行,我们以实用型为目的学习。编程类学习,从模仿中掌握突破。需要python教学视频和资料的在公众号菜单栏获取,有任何问题欢迎公众号后台联系我或加我微信。
注:import后导入的模块需要单独安装,有些是自带的,但是要实现更复杂的功能一般是安装第三方模块。安装方法:
1.win+r,调出命令提示窗口,输入cmd再按回车键。
2.输入安装指令(电脑要联网,推荐使用国内镜像网站,安装更快,不然很慢)
Python pip安装第三方库的国内镜像
Windows系统下,一般情况下使用pip在DOS界面安装python第三方库时,经常会遇到超时的问题,导致第三方库无法顺利安装,此时就需要国内镜像源的帮助了。
使用方法如下:
例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xxx(这里的xxx是模块名),这样就会从清华这边的镜像去安装pyspider库。
国内源:
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中理工大学:http://pypi.hustunique.com/
山东理工大学:http://pypi.sdutlinux.org/
豆瓣:http://pypi.douban.com/simple/
note:新版ubuntu要求使用https源,要注意。
模块的安装
今天分享用python批量对常见文件转换为pdf格式的办法,今天调用的模块是win32com。
首先是安装办法:命令提示符窗口输入:(我直接使用清华的镜像网站,更快一点。)
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pywin32
模块使用简介
win32com 模块主要为 Python 提供调用 windows 底层组件对 word 、Excel、PPT 等进行操作的功能,只能在 Windows 环境下使用,并且需要安装 office 相关软件才行(WPS也行)。
使用 win32com 模块主要是因为 Python 针对 word 文档操作的第三方库相对较少并且功能较弱,Python 有针对 .docx 后缀文件的第三方库如 python-docx、pydocx等等,但是没有针对 .doc 和 .wps 的第三方库,所以这里就只能使用 win32com 模块。 相对而言 Python 针对 Excel文档操作的第三方库就非常友好
开始战斗
from win32com.client import gencachefrom win32com.client import constants, gencacheimport os#创建PDFdef createPdf(wordPath, pdfPath): """ word转pdf :param wordPath: word文件路径 :param pdfPath: 生成pdf文件路径 """ word = gencache.EnsureDispatch('Word.Application') doc = word.Documents.Open(wordPath, ReadOnly=1) doc.ExportAsFixedFormat(pdfPath, constants.wdExportFormatPDF, Item=constants.wdExportDocumentWithMarkup, CreateBookmarks=constants.wdExportCreateHeadingBookmarks) word.Quit(constants.wdDoNotSaveChanges)#遍历当前目录,并把Word文件转换为PDFdef wordToPdf(): print("转换中...") # 获取当前运行路径 path = os.getcwd() # 获取所有文件名的列表 filename_list = os.listdir(path) # 获取所有word文件名列表 wordname_list = [filename for filename in filename_list \ if filename.endswith((".doc", ".docx"))] for wordname in wordname_list: # 分离word文件名称和后缀,转化为pdf名称 pdfname = os.path.splitext(wordname)[0] + '.pdf' # 如果当前word文件对应的pdf文件存在,则不转化 if pdfname in filename_list: continue # 拼接 路径和文件名 wordpath = os.path.join(path, wordname) pdfpath = os.path.join(path, pdfname) createPdf(wordpath,pdfpath)#word转pdfif __name__ == '__main__': wordToPdf()
开始战斗
1.将以上代码复制,创建一个py文件。
2.将批量转换的py脚本和需要转换的word文件置于一个文件夹内,然后运行文件等待结果即可。
效果图如下:
okok,今天的分享到此结束,欢迎各位三连。长按下方图片关注公众号。