【算法竞赛】如何从Kaggle下载数据 - Jupyter Notebook

本文档介绍了如何在Jupyter Notebook中通过Kaggle API下载竞赛数据。首先,需要安装Kaggle API,然后下载并上传Kaggle的授权文件kaggle.json。接着,在Kaggle上接受竞赛规则。之后,创建数据保存路径并使用特定命令下载所需比赛的数据。最后,解压下载的7zip文件以访问数据。
摘要由CSDN通过智能技术生成

01、安装Kaggle API

将下面语句在Jupyter notebook或者Terminal中运行;
在Terminal中运行时需要根据平台进行调整;(depending on your platform you may need to modify this slightly to either add source activate fastai or similar, or prefix pip with a path. Have a look at how conda install is called for your platform in the appropriate Returning to work section of https://course.fast.ai/. (Depending on your environment, you may also need to append “–user” to the command.)

! {sys.executable} -m pip install kaggle --upgrade

02、下载Kaggle的授权

登录你的Kaggle账户,点击My Account,下拉找到Create New API Token,点击下载kaggle.json文件

03、上传Kaggle.json文件

点击upload上传Kaggle.json文件至当前Jupyter notebook所在的地方,并运行下面两行命令;(如果是Windows,则运行后两行)

! mkdir -p ~/.kaggle/
! mv kaggle.json ~/.kaggle/

# For Windows, uncomment these two commands
# ! mkdir %userprofile%\.kaggle
# ! move kaggle.json %userprofile%\.kaggle

04、接受竞赛规则

在Kaggle中,进入你要下载数据的比赛,点击接受竞赛规则;(否则下载不成功)
在这里插入图片描述

05、创建保存数据的路径 并 下载

path = Config.data_path()/'planet'
path.mkdir(parents=True, exist_ok=True)
path

本命令以planet competition为例

! kaggle competitions download -c planet-understanding-the-amazon-from-space -f train-jpg.tar.7z -p {path}  
! kaggle competitions download -c planet-understanding-the-amazon-from-space -f train_v2.csv -p {path}  
! unzip -q -n {path}/train_v2.csv.zip -d {path}

命令结合具体比赛进行修改;其中 “kaggle competitions download -c planet-understanding-the-amazon-from-space“可以在对应竞赛页面data的API中找到,具体文件也有列表;
在这里插入图片描述

06. 解压文件

! 7za -bd -y -so x {path}/train-jpg.tar.7z | tar xf - -C {path.as_posix()}

如果没有安装对应的解压程序,记得先安装,此数据是7zip压缩的

! install --yes --prefix {sys.prefix} -c haasad eidl7zip

**

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值