python处理压缩文件

前言

由于不确定压缩文件里都会包含什么,需要做的处理就是把里边的内容提取到一个文件夹中,方便后续的操作;也就是说只需要解压缩文件。
考虑实际应用,暂时只支持rar类型和zip类型。

做法

用到了zipfile库,shutil库,rarfile库。
获取文件后缀看是哪一种压缩文件;
寻找输出目录,没有则创建。
code:

#in_path:压缩文件路径
#out_folder_path:压缩文件解压后生成文件夹,储存这个文件夹的文件夹路径
def get_compressed_files(in_path, out_folder_path):

    tail = get_tail(in_path)

    if (tail=='rar'):
        rar = rarfile.RarFile(in_path)
        if not os.path.exists(out_folder_path):
            os.mkdir(out_folder_path)

        os.chdir(out_folder_path)  # 用于改变当前工作目录到指定的路径
        rar.extractall()
        rar.close()

    elif (tail=='zip'):

        folder_name = get_file_name(in_path)
        out_folder_path = out_folder_path + '\\' + folder_name

        with zipfile.ZipFile(file=in_path, mode='r') as zf:
            if os.path.exists(out_folder_path):
                shutil.rmtree(out_folder_path)  # 若输出文件夹以存在,会删除原先的文件夹!!!

            # 解压到指定目录,首先创建一个解压目录
            os.mkdir(out_folder_path)

            for old_name in zf.namelist():
                # 获取文件大小,目的是区分文件夹还是文件,如果是空文件应该不好用。
                file_size = zf.getinfo(old_name).file_size
                # 由于源码遇到中文是cp437方式,所以解码成gbk,windows即可正常
                new_name = old_name.encode('cp437').decode('gbk')
                # 拼接文件的保存路径
                new_path = os.path.join(out_folder_path, new_name)
                # 判断文件是文件夹还是文件
                if file_size > 0:
                    # 是文件,通过open创建文件,写入数据
                    with open(file=new_path, mode='wb') as f:
                        # zf.read 是读取压缩包里的文件内容
                        f.write(zf.read(old_name))
                else:
                    # 是文件夹,就创建
                    os.mkdir(new_path)

    else:
        print('failed')

遇到问题:解压缩后出现中文乱码;需要判断压缩文件的编码方式,再进行解码。
解压rar找不到相应工具:需要拷贝unrar.exe到项目Scripts目录下。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值