Kaggle 是世界上所有数据科学的平台。就像一个奇怪的社交网络,到处都是数据科学家,到处都是 Jupyter 笔记本。
这是一个学习和竞争的绝佳平台,这要归功于公司在网站上发布的数量惊人的比赛,这些公司正在寻找数据科学问题的解决方案,而无需花费太多。
这个生态系统不出所料地产生了大量数据集——这就是你在这里的原因。你想用 Python 从 Kaggle 下载数据,这正是我们要做的。
验证
我们需要做的第一件事是pip install kaggle。现在,如果我们打开 Python 并尝试,import kaggle我们将看到如下内容:
我们得到这个OSError是因为 Kaggle 希望我们在允许我们使用他们的 API 之前对自己进行身份验证。要获取我们的身份验证凭据,我们只需:
- 登录 Kaggle(或注册)
- 导航到您的帐户页面(单击右上角的个人资料图片)