kaggle下载数据集步骤

https://mzgao.blog.csdn.net/article/details/86658904

一.前言

在下载之余利用间隙时间来分享Microsoft Malware Classification Challenge (BIG 2015)数据集的获取。先前笔者在搜索引擎想得到获取方式的时候,几乎没有教程是特定于这个数据集的,于是想记录这个过程。

二.准备

1.安装kaggle库

pip install kaggle

2.注册登录kaggle账户
https://www.kaggle.com/
用谷歌账号可以直接登录。
注册账号,会给你注册的邮箱发送一封激活邮件,在最后一步激活的时候人机身份验证显示不出来。

(人机验证直接用的google的,所以需要科学上网才能看到验证码)

图1 科学上网之前

图2 科学上网之后


3.下载kaggle.json

图3 打开My Account

图4 选择create NEW API Token


4.放置kaggle.json
将上述下载的kaggle.json放入如下路径的文件夹中:

图5 放置路径

三.步骤

1.规则接受
这是对kaggle上所有数据集而言,必须且关键的一步,否则在下载的时候会报"403-Forbidden"。
①点击"Rules"选项卡

图6 Rules选项卡


②滑到底部"Rules acceptance"区域,点击"I Understand and Accept"

图7 接受规则


③验证
填写用于接收验证码的手机号,注意格式(+86-xxx-xxxx-xxxx),保证VPN开启,用于显示人机身份验证(否则显示不出来)

图8 验证界面


2.下载数据集
在完成上述步骤后,进入CMD命令窗口,输入以下命令就可以用kaggle API下载数据集了:

kaggle competitions download -c malware-classification

这个命令在对应比赛数据集的"Data"选项卡对应的内容中,直接复制粘贴即可。

图9 kaggle命令

四.结果

最终文件会下载到"C:\Users[username]"中。

图10 下载过程

五.小结

以上是笔者就大家可能会遇到的问题进行的总结,希望对各位有所帮助。



作者:丶青霜
链接:https://www.jianshu.com/p/f269b4fa0814
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

  • 6
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值