前言
最近需要下个存在Google Drive上的数据集,用浏览器下载总是下一会就失败。最后想了个办法用python直接下,比浏览器下稳定很多。
本文灵感来自如何优雅的快速下载谷歌云盘的大文件 (二)
1、google drive
首先把要下载数据集文件夹的快捷方式存到云盘里
然后下载windows的google drive登陆之后,资源管理器中就会出现一个虚拟地址,打开可以看到刚刚存的快捷方式
2、代理挂上全局
建议用个稳定点的
3、跑下python
import os
import shutil
import time
def copy_with_progress(src, dst, max_retries=3):
total_size = os.path.getsize(src)
for attempt in range(max_retries):
copied_size = 0
with open(src, 'rb') as fsrc, open(dst, 'wb') as fdst:
while True:
buf = fsrc.read(1024 * 1024) # 每次读取 1MB
if not buf:
break
fdst.write(buf)
copied_size += len(buf)
percent = (copied_size / total_size) *