本文介绍了如何下载kaggle数据集的方法。
若有错误,请在评论中为我指出来,不胜感激。
1 介绍
Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。[1]。
该平台由于举办多种领域的数据分析、机器学习竞赛,具有很多有价值的数据集可供下载。
下面介绍一下如何下载该平台的数据集。
以下是 kaggle 的数据集下载过程,建议翻墙!
2 安装kaggle库
首先你需要安装python,配置好环境变量。
然后需要安装好python的库安装工具pip,并配置好环境变量。
然后通过命令行安装kaggle库。
pip install kaggle
3 注册kaggle账号
首先你需要先在kaggle平台上注册账户。
点击右上角 Sign In,然后选择register。
注册完成后登录。
4 找到自己想要的数据集
点击左上角search,输入自己想要的数据集并搜索找到它。
5 接受规则
找到比赛后点击rules,接受它I understand and accept。
是第一次的话可能需要验证手机号,输入手机号(最前面加860)后验证,然后send a code。
收到验证码后输入进行验证。
5 下载kaggle身份认证的 json文件
右上角选择my account
找到API接口,create new API token 下载json文件。
6 下载数据集
在 C:\Users\(xxx)\ 目录下创建文件夹命名 .kaggle。
将下载下来的json文件放入.kaggle文件夹中。
在数据集页面点击 Data
往下找到
API接口命令,点击一下就复制到了剪切板。
打开命令行粘贴回车,就开始下载数据集了。