kaggle下载数据到远端服务器 Wget

这篇讨论 怎么从kaggle上直接下载数据到远端服务器。
1.先进入kaggle比赛中data选项,点击Download All,下载到本地在这里插入图片描述
2.ctrl + j,右击severstal-steel-defect-detection.zip,选择copy link address。应该得到类似 https://storage.googleapis.com/kaggle-competitions-data/kaggle/14241/574364/all.zip?GoogleAccessId=web-data@kaggle-161607.iam.gserviceaccount.com&Expires=1570174221&Signature=EExbMGP233Eqp16ytbAKWmQSSAVmw0Bh2EfuySbkatFlqANAnpksl1eSLJqFw9ObtKyAiwKrf0rxi%2FUnsbNw83IovOiSO8ZVPa4zTAYzcsPIl2sVyvTrOxKPXYV6w8zftBdFzfLujLeOBTlWf1sNIGrk6x8rhMcy1YA6BTPp6Qto8NppUjhkfdA40oCMzWbozxsSEuSXHEdbp4Aa9VWN31vSzXZ445g74QA7kstubRiqt90OLbbCj1%2BdjznodGu%2Fi4nxXMrEHLVQafh4W6RP3Z82yCtWuQM2OsAau7FQc5ZHlFx4sqhFSNFdbcP0tjjrU7LReaqZ8BPro9JoxSOS0Q%3D%3D&response-content-disposition=attachment%3B+filename%3Dseverstal-steel-defect-detection.zip
在这里插入图片描述
3. 在ssh上输入 Wget “https://storage.googleapis.com/kaggle-competitions-data/kaggle/14241/574364/all.zip?GoogleAccessId=web-data@kaggle-161607.iam.gserviceaccount.com&Expires=1570174221&Signature=EExbMGP233Eqp16ytbAKWmQSSAVmw0Bh2EfuySbkatFlqANAnpksl1eSLJqFw9ObtKyAiwKrf0rxi%2FUnsbNw83IovOiSO8ZVPa4zTAYzcsPIl2sVyvTrOxKPXYV6w8zftBdFzfLujLeOBTlWf1sNIGrk6x8rhMcy1YA6BTPp6Qto8NppUjhkfdA40oCMzWbozxsSEuSXHEdbp4Aa9VWN31vSzXZ445g74QA7kstubRiqt90OLbbCj1%2BdjznodGu%2Fi4nxXMrEHLVQafh4W6RP3Z82yCtWuQM2OsAau7FQc5ZHlFx4sqhFSNFdbcP0tjjrU7LReaqZ8BPro9JoxSOS0Q%3D%3D&response-content-disposition=attachment%3B+filename%3Dseverstal-steel-defect-detection.zip” --no-check-certificate -O severstal-steel-defect-detection.zip
4.
wget ‘URL’ --no-check-certificate -O FILENAME

Notice the URL needs to be wrapped in ’ ’ single quotes.
在这里插入图片描述
5. 下载完成后,可以用unzip解压 unzip severstal-steel-defect-detection.zip

此方法是TuTTuRu同学教授,感谢ing!

### 将Kaggle数据下载服务器 #### 准备工作 为了能够通过API方式将Kaggle数据下载服务器,首先需要完成一些准备工作。这包括但不限于安装`kaggle` Python库以及配置必要的认证文件。 确保Python环境已经设置好之后,可以通过pip来安装`kaggle`工具: ```bash pip install kaggle ``` 接着,在本地机器上登录Kaggle账号获取API Token,并将其保存为JSON格式的文件(即`kaggle.json`),该文件包含了用于身份验证的信息。随后,需将此文件传输至目标Linux服务器上的特定位置以便后续操作可以顺利执行[^1]。 #### 配置认证信息 一旦拥有上述提到的`kaggle.json`文件,则应按照如下路径放置于服务器之中:`/home/username/.kaggle/kaggle.json`;其中`username`代表当前用户的主目录名。另外,出于安全考虑,还需调整这个文件的读写权限,使之仅限于属主可访问: ```bash chmod 600 ~/.kaggle/kaggle.json ``` 以上步骤完成后便意味着完成了初步设定过程[^4]。 #### 执行下载指令 当一切准备就绪后,就可以利用命令行轻松实现远程批量下载所需资源了。假设想要获取名为`dataset-name`的数据集合,那么只需运行下面这条简单的CLI命令即可达成目的: ```bash kaggle datasets download -d dataset-owner/dataset-name ``` 这里需要注意的是,实际应用时应当替换掉`dataset-owner`和`dataset-name`这两个占位符,使其对应真实的作者用户名与作品ID[^3]。 对于某些特别庞大的资料包来说,如果遇到网络状况不佳或者其他因素影响正常接收进度的情况下,还可以尝试借助`wget`工具配合官方提供的直链来进行手动拉取作业。不过这种方式相较于前者会显得稍微复杂一点,因为它往往涉及到处理SSL证书校验等问题[^5]。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值