题目2：递归解压缩文件，并计算压缩包中的所有文件内保存的数字之和-CSDN博客

一、题目

定义文件 xx.tar.gz 的产生方式如下：

以 xx 为文件名的文件通过 tar 和 gzip 打包压缩产生，该文件中以字符串的方式记录了一个非负整数；
或者以 xx 为名的目录通过 tar 和 gzip 打包压缩产生，该目录中包含若干名如 xx.tar.gz 的压缩包。

其中 xx 即 00、01、02、03 这样的数字。现给定一个根据上述定义生成的文件 00.tar.gz，请确定其中包含的以xx 为文件名的文件个数以及这些文件中所记录的非负整数之和。

一个按此规则生成的文件 00.tar.gz 的下载地址：http://pan.baidu.com/s/1mgBpurQ

二、分析

本题利用了递归的方法对压缩包 00.tar.gz 及其下子压缩包进行解压缩后读取文件

三、代码

import os
import tarfile
import time

time_start = time.time()

#解压缩函数
def unpack_path_file(parentdir, file_name):
    archive = tarfile.open(parentdir + "/" + file_name, "r:gz")
    for tarinfo in archive:
        archive.extract(tarinfo, parentdir)
    archive.close()

#初始目录
root_dir = "temp"
#结果值
result = 0

#检查目录
def search_folder(parent_dir):

    global result
    #print("检查目录：" + parent_dir)

    #解压缩所有可解压文件
    for file_name in os.listdir(parent_dir):
        #print(file_name)
        if os.path.isfile(parent_dir + "/" + file_name) and file_name.find(".tar.gz") != -1:
            #print("解压缩压缩包：" + parent_dir + "/" + file_name)
            unpack_path_file(parent_dir, file_name)

    #计算所有解压后文件内容
    for file_name in os.listdir(parent_dir):
        if os.path.isfile(parent_dir + "/" + file_name) and file_name.find(".tar.gz") == -1:
            #print("读取文件：" + parent_dir + "/" + file_name)
            temp_file = open(parent_dir + "/" + file_name)
            number = temp_file.read()
            temp_file.close()
            result = result + int(number)
            #print("读取到的数字：" + number + "；数字总和：" + str(result))

    #进入子目录继续
    for dir_name in os.listdir(parent_dir):
        if os.path.isdir(parent_dir + "/" + dir_name): 
            #print("搜索目录：" + parent_dir + "/" + dir_name)
            search_folder(parent_dir + "/" + dir_name)

search_folder(root_dir)

#输出结果
time_finish = time.time()
time_span = time_finish - time_start
#print("一" * 10)
print("计算结果：" + str(result))
print("共计用时：%.2f" % time_span)

四、运行结果

以下是该段代码在Python3.4.2中的运行结果：