Kaggle 数据集下载

kaggle数据集一般比较大,比如这次dstl更是达到22GB。国内连kaggle下载经常会断。尤其是kaggle需要认证才能下载,直接点击链接就是浏览器下载

于是对策:

1.wget

 wget -x --load-cookies cookies.txt -P data -nH --cut-dirs=5 https://www.kaggle.com/c/dstl-satellite-imagery-feature-detection/download/three_band.zip 

 wget https://www.kaggle.com/account/login?ReturnUrl=%2fc%2fdstl-satellite-imagery-feature-detection%2fdownload%2fthree_band.zip --post-data 'username=account&password'

在Linux命令行使用wget提交cookie,账号密码下载 ,但是网实在不好,下的慢不说,还是会断。

2.迅雷

迅雷就特别棒,因为也有别人下大概,所以能加速,但注意要认证。

kaggle认证方式比较奇特,我对他认证机制的理解:

链接的地址是.zip所以直接把它添加到迅雷任务是不行的,浏览器里每次下载会生成一个单独的认证码,一旦取消下载任务,这个认证码就会失效

也就是在火狐浏览器中右键已经在下载的任务,复制link到迅雷,注意不能取消下载任务后再去迅雷创,否则会失效。

一旦迅雷不是0k/s就可以取消浏览器里的下载任务啦,一两天数据集就下下来了

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值