薅羊毛 Colab使用外部数据的7种方法!

Colab作为非常强大且优惠的计算平台,一直广受大家喜爱。可以随时随地使用,还有免费的GPU可以薅羊毛。

那么如何在Colab中使用外部数据集,来完成竞赛呢,本文将给出几种常见的方法。

方法1:通过Files explorer上传

点击Notebook的Files explorer面板:

75f4fba8001af3e7e028966dff1a29cc.png

然后点击上传按钮:

9af8d3e81cca42287b4e258d67b8d78e.png

当上传结束后,就可以直接读取:

e6f945318c3116a6f15fc8110f64ee88.png

方法2:使用Colab files上传

输入并运行下面代码:

from google.colab import files
uploaded = files.upload()

e19f56f1a592ba9dd62f901307f97909.png

然后就可以选择对应的文件,完成上传:

7e75c87cb36e3685b7da2b7bdf26833f.png

方法3:读取Github链接

在github页面找到对应的文件路径,注意是文件的Raw链接:

68ae4bb35951c0f7eac45189a991307f.png

然后将链接写到对应的位置。

方法4:克隆Github项目

先从命令行下载项目:

!git clone https://github.com/BindiChen/machine-learning.git

然后从对应的路径完成数据读取。

d4712d69d080b377ad5bc8ddd7b8bbed.png

方法5:使用wget/axel下载文件

在Notebook中可以使用Linux系统命令,可以使用wgetaxel下载数据:

2eafda339a49c2c4a9026a742ec52679.png

方法6:读取谷歌硬盘数据

挂载了谷歌硬盘后,写好路径完成读取:

a05a5c86c4a643c3eb42a4f35a68f100.png

2b45ea133ef2745481264ea79dd2bf71.png

方法7:Kaggle API完成数据下载

首先在Kaggle账户的Kaggle API,点击Create New API Token,会下载一个kaggle.json文件。

c071dc6e89c35e6994e3d0a53c631ec7.png

kaggle.json文件上传后,就可以使用kaggle-api下载比赛数据或者数据集。

!kaggle competitions download -c titanic
!kaggle datasets download -d alexanderbader/forbes-billionaires-2021-30

1a685096c721a49df41f4c5aa74c41aa.png

 
 

b572977237b35c7f0f32257ed5552e76.jpeg

 
 
 
 
 
 
 
 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值