薅羊毛 Colab使用外部数据的7种方法!

088982968dfd6dc666978ced136657ff.png

文 | Coggle
源 | Coggle数据科学

Colab作为非常强大且优惠的计算平台,一直广受大家喜爱。可以随时随地使用,还有免费的GPU可以薅羊毛。那么如何在Colab中使用外部数据集,来完成竞赛呢,本文将给出几种常见的方法。

方法1:通过Files explorer上传

点击Notebook的Files explorer面板:656e8578967b7310ac82f849e5cf2b12.png然后点击上传按钮:cf6c9aacc6a4bf942b5d70f205a3a9b0.png当上传结束后,就可以直接读取:a58d88aca07321d3a09db9633f34feef.png

方法2:使用Colab files上传

输入并运行下面代码:

from google.colab import filesuploaded = files.upload()

a49a10ad0adde1258eda92e851768a06.png然后就可以选择对应的文件,完成上传:32fdf2c50201fdeac88ca8c8e335f9b4.png

方法3:读取Github链接

在github页面找到对应的文件路径,注意是文件的Raw链接:49b8f75293426c7eb4cbb1abea794889.png然后将链接写到对应的位置。

方法4:克隆Github项目

先从命令行下载项目:

!git clone https://github.com/BindiChen/machine-learning.git

然后从对应的路径完成数据读取。d7759e06c52046307a217f98da8e1dbb.png

方法5:使用wget/axel下载文件

在Notebook中可以使用Linux系统命令,可以使用wgetaxel下载数据:5e7bb9a39c4c4e86ddd2ec2dd029578a.png

方法6:读取谷歌硬盘数据

挂载了谷歌硬盘后,写好路径完成读取:7863f054fa6148f2e598fb5cc3085974.pngcc4c2092dff8db52f84f345ddaaba5af.png

方法7:Kaggle API完成数据下载

首先在Kaggle账户的Kaggle API,点击Create New API Token,会下载一个kaggle.json文件。576925ab1fa0385bcbcdea99259e29ef.pngkaggle.json文件上传后,就可以使用kaggle-api下载比赛数据或者数据集。

!kaggle competitions download -c titanic!kaggle datasets download -d alexanderbader/forbes-billionaires-2021-30
5b7e37f9a83a0e20b44f1ec0c7046e0b.png

0e601f1d6ff553292fb3c20f611703b7.png后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

d93bb478e0efed6edf2bf81a9e1a4d6d.gif
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值