前言
由于不确定压缩文件里都会包含什么,需要做的处理就是把里边的内容提取到一个文件夹中,方便后续的操作;也就是说只需要解压缩文件。
考虑实际应用,暂时只支持rar类型和zip类型。
做法
用到了zipfile库,shutil库,rarfile库。
获取文件后缀看是哪一种压缩文件;
寻找输出目录,没有则创建。
code:
#in_path:压缩文件路径
#out_folder_path:压缩文件解压后生成文件夹,储存这个文件夹的文件夹路径
def get_compressed_files(in_path, out_folder_path):
tail = get_tail(in_path)
if (tail=='rar'):
rar = rarfile.RarFile(in_path)
if not os.path.exists(out_folder_path):
os.mkdir(out_folder_path)
os.chdir(out_folder_path) # 用于改变当前工作目录到指定的路径
rar.extractall()
rar.close()
elif (tail=='zip'):
folder_name = get_file_name(in_path)
out_folder_path = out_folder_path + '\\' + folder_name
with zipfile.ZipFile(file=in_path, mode='r') as zf:
if os.path.exists(out_folder_path):
shutil.rmtree(out_folder_path) # 若输出文件夹以存在,会删除原先的文件夹!!!
# 解压到指定目录,首先创建一个解压目录
os.mkdir(out_folder_path)
for old_name in zf.namelist():
# 获取文件大小,目的是区分文件夹还是文件,如果是空文件应该不好用。
file_size = zf.getinfo(old_name).file_size
# 由于源码遇到中文是cp437方式,所以解码成gbk,windows即可正常
new_name = old_name.encode('cp437').decode('gbk')
# 拼接文件的保存路径
new_path = os.path.join(out_folder_path, new_name)
# 判断文件是文件夹还是文件
if file_size > 0:
# 是文件,通过open创建文件,写入数据
with open(file=new_path, mode='wb') as f:
# zf.read 是读取压缩包里的文件内容
f.write(zf.read(old_name))
else:
# 是文件夹,就创建
os.mkdir(new_path)
else:
print('failed')
遇到问题:解压缩后出现中文乱码;需要判断压缩文件的编码方式,再进行解码。
解压rar找不到相应工具:需要拷贝unrar.exe到项目Scripts目录下。