下载google drive上的数据集方法

最新推荐文章于 2025-02-21 16:45:44 发布

BrokenAboom

最新推荐文章于 2025-02-21 16:45:44 发布

阅读量1.1k

点赞数 5

文章标签： python 深度学习大数据机器学习 ai

本文链接：https://blog.csdn.net/BrokenAboom/article/details/140561104

版权

前言

最近需要下个存在Google Drive上的数据集，用浏览器下载总是下一会就失败。最后想了个办法用python直接下，比浏览器下稳定很多。

本文灵感来自如何优雅的快速下载谷歌云盘的大文件（二）

1、google drive

首先把要下载数据集文件夹的快捷方式存到云盘里
在这里插入图片描述

然后下载windows的google drive登陆之后，资源管理器中就会出现一个虚拟地址，打开可以看到刚刚存的快捷方式
在这里插入图片描述

2、代理挂上全局

建议用个稳定点的

3、跑下python

import os
import shutil
import time

def copy_with_progress(src, dst, max_retries=3):
    total_size = os.path.getsize(src)

    for attempt in range(max_retries):
        copied_size = 0

        with open(src, 'rb') as fsrc, open(dst, 'wb') as fdst:
            while True:
                buf = fsrc.read(1024 * 1024)  # 每次读取 1MB
                if not buf:
                    break
                fdst.write(buf)
                copied_size += len(buf)
                percent = (copied_size / total_size) *