背景:下载到的zip文件后,需要校验里面文件的数据信息
思路:解压后,读取excel文档的信息
关键点 解压 读取
对于解压,之前是在python中通过dos命令来解压zip文档,这几天看了python的标准库,发现zipfile也可以实现同样的功能,具体的源代码如下
import zipfile
import re
import os
reg="1500277\d*.zip"
"遍历文件夹下的文件,匹配的放到list中"
lis=[]
for parent,dirnames,filenames in os.walk("C:/Users/160505/Downloads/"):
for filename in filenames:
if re.match(reg,filename):
lis.append(filename)
print filename.decode('gbk')
print lis
for i in lis:
file_path="C:/Users/160505/Downloads/%s" %i
zfile = zipfile.ZipFile(file_path,'r')
for filename in zfile.namelist():
# print filename.decode('gbk')
data = zfile.read(filename)
file = open(filename, 'w+b')
file.write(data)
file.close()
注意事项 ·1:当下载到的zip的名称不是固定的时候,先用正则进行匹配,再读取准确的文件名称
2、针对中文的处理,需要做字符的转码