使用wget从Google Drive下载数据集

最新推荐文章于 2025-02-25 18:08:18 发布

YuhsiHu

最新推荐文章于 2025-02-25 18:08:18 发布

阅读量5.4k

点赞数 4

文章标签：服务器运维

本文链接：https://blog.csdn.net/YuhsiHu/article/details/123259851

版权

许多用于训练的数据集很大，一般通过Google Drive进行分享，而出于磁盘容量和方便训练的考虑，这些数据我们一般放在服务器上，服务器没有图形界面，因此我们需要使用wget来进行下载。

Google Drive的链接格式是这个样子的：

https://drive.google.com/file/d/<fileid>/view

我们要关注的是<field>，这相当于文件的编号。以cascade-stereo分享的DTU数据集为例，Google Drive的链接如下

https://drive.google.com/file/d/1eDjh-_bxKKnEuz5h-HXS7EDJn59clx6V/view

我们将这个编号命名为${field}，将我们希望它保存成的文件名命名为${name}，那么通过wget下载的命令如下：

sudo wget --load-cookies /tmp/cookies.txt "https://drive.google.com/uc?export=download&confirm=$(wget --quiet --save-cookies /tmp/cookies.txt --keep-session-cookies --no-check-certificate 'https://drive.google.com/uc?export=download&id=${field}' -O- | sed -rn 's/.*confirm=([0-9A-Za-z_]+).*/\1\n/p')&id=${field}" -O ${filename} && rm -rf /tmp/cookies. txt

我们只需要将变量替换即可，注意有两个地方有${field}，有一个地方有${filename}。

下载完成之后，只需要使用unrar解压rar文件到当前文件夹下即可