百度松果菁英班——机器学习实践一：海量文件遍历

杜若南星

于 2024-04-06 19:39:25 发布

阅读量738

点赞数 10

分类专栏：百度松果菁英班课程学习文章标签： python 算法开发语言百度机器学习经验分享笔记

本文链接：https://blog.csdn.net/qq_63349644/article/details/137435996

版权

本文介绍了如何在Python中使用`unzip_data`函数解压缩ZIP文件，并通过`get_size_type`函数统计指定目录下不同文件类型的数量和总内存占用。同时提到作者对于机器学习的初学者身份，欢迎读者参与讨论和学习百度松果菁英班的机器学习内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

飞桨AI Studio星河社区-人工智能学习与实训社区

!tree -L 显示级数限制 指定目录

如：

!tree -L 3 ./data/

表示：在目录 ./data/ 下显示目录结构，限制显示到第三级子目录或文件。这个命令通常在命令行环境（即shell）下使用，用于查看目录结构，以便更好地了解目录中包含的文件和子目录。

🦐将指定路径下的ZIP文件解压缩到目标路径下（unzip_data）

import zipfile 
def unzip_data(src_path,target_path):
    # 解压原始数据集，将src_path路径下的zip包解压至target_path目录下
    if(not os.path.isdir(target_path)):     
        z = zipfile.ZipFile(src_path, 'r')
        z.extractall(path=target_path)
        z.