python读取word文档中的图片_【Python 3 获取Word所有图片】

上次讲到如何手动快速提取Word文档中的所有图片。这次我们用Python-3基于图片提取原理,写代码实现自动获取。

Python 3实现代码import os,zipfile,shutil #引入os(文件及目录操作)、zipfile(zip文件操作)、shutil(拷贝文件)库

def getimage(docdir): #自定义getimage函数,用于实现Word文档图片获取功能

os.chdir(docdir) #改变当前工作目录到传递过来的的路径

dirlist = os.listdir(docdir) #获取该目录下的所有文件夹包含的文件或文件夹的名字的列表

for i in dirlist:

if i.endswith(".docx"): #匹配docx文件

docname = i.split(".") #以“.”做成列表形式

os.rename(i,"%s.ZIP"%docname[0]) #重命名为ZIP格式

f = zipfile.ZipFile("%s.ZIP"%docname[0], 'r')

for file in f.namelist():

if "word" in file:

f.extract(file) #将压缩包里的word文件夹解压出来

f.close()

oldimagedir = r"%s\word\media"%docdir #定义图片文件夹

shutil.copytree(oldimagedir,"%s\%s"%(docdir,docname[0])) #拷贝到新目录,名称为word文件的名字

os.rename("%s.ZIP" % docname[0],"%s.docx"% docname[0]) #将ZIP名字还原为DOCX

shutil.rmtree("%s\word"%docdir) #删除word文件夹

if __name__=="__main__": #主程序入口

getimage('d:\Python_tool\图片比对') #调用图片获取函数,传递目录

以上是功能实现源代码,感兴趣的小伙伴可以自己动手尝试一下。另外EXCEL的实现同上,只要把.docx改成.xlsx就可以了。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值