1 安装python的kaggle库
命令行输入pip install kaggle
命令行输入kaggle competitions list后会自动在C盘用户下创建一个.kaggle文件夹。
2 注册kaggle账号
注册kaggle账号,官网,Kaggle: Your Machine Learning and Data Science Community
点击右上角 Sign In,然后选择register。注册后,登陆账号。登录后右上角选择account-API(Create New API Token),会得到kaggle.json文件,将其放在上述.kaggle文件夹下。
3 找到要下载的数据,选择rules,接受规则,点击接受后要进行手机号校验,你会发现没有校验按钮,因为下面少了一排人机校验的界面, Google reCaptcha校验无法显示。解决步骤如下:
(1)安装 Header Editor 插件,百度自己下载一个,得到header-editor.crx后,再将该文件解压成文件夹,打开google拓展程序,开发者模式,将解压后得文件夹拖进去即可。
(2)点击扩展程序中Header Editor右侧选择选项。
(3)选择导入和导出,下载规则填写https://azurezeng.github.io/static/HE-GoogleRedirect.json
(4) 然后点击下载按钮,然后点击保存。最后规则列表显示如下。
配置好以后,再次点击接受后界面如下,输入手机号校验,输入手机收到的验证码即可:
4 配置好后可以下载数据啦
找到数据页面的下载命令,复制,在命令行输入即可。
备注:接受规则很重要,否则命令下载时会出现403 – Forbidden