附录1-kaggle的使用

kaggle是一个可以下载数据集的网站,除了可以下载数据集以外,我们还可以使用kaggle的免费GPU资源,我们可以在kaggle上训练模型

这个是kaggle的网址Kaggle: Your Machine Learning and Data Science Community

如果没注册的朋友可以注册一个账号,在注册账号中验证码环节会出现过不了墙无法看到验证码的问题,我们在谷歌浏览器中安装一个插件可以解决这个问题

目录

1  安装插件

2  下载规则文件

3  使用Header Editor

4  登陆kaggle

5  添加数据集

5.1  添加kaggle中的数据集

5.2  上传数据集

6  使用GPU或连接网络(使用requests库等)


1  安装插件

参考文章链接 Google 人机验证(reCaptcha)无法显示解决方案(可解决大多数 CSP 问题) – Azure Zeng's Blog

  • 这个插件只能在谷歌浏览器中使用

谷歌浏览器也有其他好用的插件,我们可以在这里进行下载 https://chrome.pictureknow.com

我们先下载一个Header Editor.crx这个文件,这个文件网上可以搜到

下面是这个文件的百度云链接

链接:百度网盘 请输入提取码 提取码:mpj1

点击浏览器右上角的三个点,之后选择更多工具,之后点击扩展程序

进入页面后,打开右上角的开发者模式,下图的状态是打开的状态,打开之后把Header Editor.crx文件拖到画红框的区域

点击添加扩展程序

  • 图标一定要和我上面的一样,要不不对

这样就添加完毕了

2  下载规则文件

我们需要下载规则文件,在github中GitHub - AzureZeng/azurezeng.github.io: My main page on github

我们需要这里的json文件

我们整体把它下载下来,然后解压,得到这个json文件

3  使用Header Editor

之后我们点击详细信息

然后在下面找到扩展程序选项,之后点击它

点击导入与导出

之后我们点击导入

找到json文件,然后点击打开

此时在下方会出现这些,我们点击保存

保存后,浏览器下方会显示导入成功,此时我们就已成功使用插件,kaggle上的人机验证我们就都可以看到了

4  登陆kaggle

kaggle登陆之后的页面是这样的

我们最常用的功能是左侧的datasets与code,datasets是找数据集的,code是写代码的,我们在这里就要详细介绍code

点进code之后,我们可以点击Your work 来查看过往的代码

我当前的账号之前没有创建项目,所以我们这里没有显示

我们点击 New Notebook创建新的notebook文件

点开之后是这样的,这个和我们的jupyter notebook的界面就很相似了,jupyter notebook的基本用法可以看一下这个 Jupyter notebook 基本用法_potato123232的博客-CSDN博客_notebook的markdown

我们看一下在这个notebook中都安装了什么库

我们发现安装了很多的库,往下面看可以看到tensorflow也已经在这个notebook中安装好了

5  添加数据集

在界面的右侧又Data这一栏,我们可以添加kaggle网站中的数据集,或者我们可以自己上传数据集

5.1  添加kaggle中的数据集

我们现在点击 Add data,点开后我们可以在右上角搜索数据集,之后选择添加

添加之后我们就在input中看到了该数据集

我们现在使用左侧的代码块读取一下这个数据集,首先我们先导入库

然后我们找到数据集的位置

之后我们使用pandas进行读取

然后我们看一下这个数据集的头部

这样就证明我们的数据集读取进来了,后面我们就要根据每个人不同的需求进行使用了

5.2  上传数据集

  • 在kaggle中上传数据集需要翻墙才能上传

如果要添加kaggle中没有的数据集,我们选择upload

输出数据集名称,然后点击Brose Files

我们可以选择猫狗数据集_2000.zip然后选择打开

之后我们等待传输就可以了,上传完毕之后点击create就可以了

6  使用GPU或连接网络(使用requests库等)

这个时候我们需要使用这里的Settings,然后点击Get phone verified

点击之后我们进入了这个界面,之后选择+86,然后输出手机号

进行人机验证后点击send code,进入下面这个界面

输入验证码后点击verify,之后我们的settings会变成这样

我们可以把Internet开启,然后在Accelerator中选择GPU

点击后弹出提示,每一周都有固定的免费GPU使用时长,我们在这里点击Turn on GPU

在settings中我们可以看到GPU的时长

我们使用code验证一下是否使用了gpu

Internet这个选项在我们下载预训练模型,或者内置数据集中需要用到,这个没有时长限制,我们开着就行

GPU的使用时间是无论你代码是否使用GPU,它都会计算时长,所以我们这个GPU如果长时间不用我们需要给它关上,关闭的时候在Accelerator中选择None就可以了

  • 6
    点赞
  • 64
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
Kaggle 是一个数据科学和机器学习社区平台,提供了丰富的数据集、竞赛和教程资源。下面是一个简单的 Kaggle 使用教程: 1. 注册一个 Kaggle 账号:访问 Kaggle 官网(https://www.kaggle.com/)并点击右上角的 "Sign Up" 进行注册。 2. 探索数据集:在 Kaggle 上有数千个开放的数据集可供使用。你可以通过搜索或浏览不同的领域和主题来找到感兴趣的数据集。 3. 下载数据集:一旦你找到了想要使用数据集,你可以点击数据集页面上的 "Download" 进行下载。 4. 参加竞赛:Kaggle 上有举办各种机器学习竞赛,你可以选择参加感兴趣的竞赛。竞赛页面会提供详细的问题描述、数据集和评估指标等信息。 5. 提交结果:在竞赛页面上,你可以下载竞赛提供的训练和测试数据集。你需要使用训练数据集建立模型,并在测试数据集上进行预测。最后,你将提交你的预测结果,Kaggle 会根据评估指标对你的结果进行评估。 6. 加入讨论和社区:Kaggle 是一个活跃的社区平台,你可以加入不同的讨论组、论坛或组织,并与其他数据科学家、机器学习工程师交流和分享经验。 此外,Kaggle 还提供了大量的教程和内置的笔记本资源,用于学习和实践机器学习算法和数据分析技术。你可以在 Kaggle 上搜索并浏览相关的教程资源,以提升你的数据科学技能。 希望这个简单的教程能帮助你开始使用 Kaggle!如有更多问题,请继续提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Suyuoa

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值