如何在colab中加载数据集并且运行文件

最新推荐文章于 2025-02-15 11:09:38 发布

Clownorange

最新推荐文章于 2025-02-15 11:09:38 发布

阅读量9.3k

点赞数 14

分类专栏：笔记文章标签： google tv

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lcnana/article/details/122409044

版权

笔记专栏收录该内容

29 篇文章

订阅专栏

本文介绍了三种导入数据集的方法：从本地机器导入、从Google云端硬盘导入及从Kaggle网站导入。具体步骤包括：选择本地文件、登录谷歌账号装载云端硬盘、安装Kaggle库并配置密钥等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

方式1：从本地机器导入数据集
方式2：从google drive导入
方式3：导入kaggle网站提供的数据集

方式1：
在这里插入图片描述
选择导入本地的文件，注意导入的文件智慧自会对本次会话生效。
此外，还可以获得本地导入的文件的路径以及文件名称

路径如下图所示：

在这里插入图片描述
方式2：
适用场景：当本地资源有限的时候，我们可以将下载好的数据集上传到google drive中。或者需要在不同的终端使用的数据，可以存放在云端。
1：先打开云端硬盘

2：选择新建

3：选择新建文件夹或者文件
在这里插入图片描述
4：这里我们选择文件夹并上传文件

登录谷歌邮箱并且装载谷歌云云盘在这里插入图片描述

查看即可：

方式3：从Kaggle网站导入数据
打开kaggle网站：
在这里插入图片描述
登录以后来到个人信息的界面

点击account：

点击new api token,下载相应的json文件，文件中包含个人用户名以及相应的密钥

进入google网站，安装kaggle库，输入以下指令执行：

!pip install -q kaggle

在这里插入图片描述

再从本地导入kaggle的json文件

from google.colab import files
files.upload()

在这里插入图片描述
创建一个文件夹来保存kaggle的用户名以及密钥

!mkdir ~/.kaggle

在这里插入图片描述

复制文件到指定的路径下面：

!cp kaggle.json ~/.kaggle/

在这里插入图片描述

设置文件的权限，600：拥有者可以进行读写操作，其他人没有权限。chmod是changemod的简写

!chmod 600 ~/.kaggle/kaggle.json

在这里插入图片描述

列出kaggle提供的所有的数据集

! kaggle datasets list

在这里插入图片描述

如果想要下载某个指定的数据集，例如下面的数据集，我们点击data之后，下拉
liru
复制API：
在这里插入图片描述
粘贴到notebook中，在前面加上感叹号，运行代码

在这里插入图片描述
，OK，似乎出了点小question
下载数据集到指定文件夹中，先修改路径：

再运行下载数据集的命令，会将数据集下载到我们指定的位置

针对遇到的这个问题：

Warning: Looks like you’re using an outdated API Version, please consider updating (server 1.5.12 / client 1.5.4)

在这里插入图片描述
解决方法：

!pip install --upgrade --force-reinstall --no-deps kaggle

运行结果：
在这里插入图片描述

再重新下载一次数据集
在这里插入图片描述
如果下载到zip包，可以使用解压缩指令：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。