【数据竞赛】Kaggle注册、报名提交操作指南 v2.0

Kaggle注册

步骤1: https://www.kaggle.com/account/login

Kaggle支持两种注册,使用谷歌账号注册 或 邮箱注册。因为现在Kaggle被谷歌收购,推荐第一种方法,即使用谷歌账号/邮箱注册。

f9511c7e3c24664884c08549d2370b68.png

如果使用其他邮箱注册,建议使用稳定的邮箱,比如qq邮箱。不要用小众邮箱,邮箱关闭了你Kaggle账号的丢了。

步骤2:填写个人信息,这里需要验证码,需要网络代理(你要能上谷歌)。已经需要一个手机号码用于接收短信验证码。

1aa2644558c2dcd66341773af6612d8d.png

Kaggle参加比赛

步骤1:https://www.kaggle.com/competitions

先登录Kaggle账号,然后找到你要参加的比赛,并点击进去。

7a0338ccfa51ba3dc4e1e0b3fe83ba7f.png

步骤2:点击比赛页面的【Join Competition】,并点击【Accept】即可参赛。

d27d03925aa7a5e69bf02d30f05d1a5a.png

cc3866dedbb077a11686a7ff25f6d005.png

Kernel使用与提交

Kernel基础介绍

Kaggle Kernel是Kaggle平台提供给选手的运行环境,可以视为一个在线的Notebook,在线的Nobteook可以用于运行自己的代码(与Kaggle比赛相关与否无所谓),也可以通过在线Notebook完成比赛的提交。

点击下图中的【Your work】可以找到你自己的Notebook。

7b739d5d72ac61829b2c3761df9ed1d3.png

你可以在一个具体Kaggle比赛的的【Code】界面找到,和这个比赛相关的Notebook。这些Notebook都是和这个比赛相关的,有一些用于数据分析,也有一些是用于建模的。

9b167155dc479f966af1fd2665203c61.png

在比赛的【Code】页面,点击页面的右边【Hotness】的按钮,可以切换Notebook的排序方式,分别是按照【热度、点赞数、评论数、创建时间、运行时间、分数】排序。这里可以关注下按照【分数】排序,我们可以很方便的找到最高分数的分享。

ea1841435ca3d5a8427787808ed778e0.png

如果点击进入一个具体的Notebook,和如下界面类似,是Notebook的展示状态,也就是运行完成后的状态。具体的组成元素如下图所示,此时可以点击【Copy and Edit】将这个Notebook fork一份,也就是复制一份为自己的。

Kernel运行和提交

如果点击【Copy and Edit】或在Kaggle上任意界面点击【New Notebook】,都会进入Notebook的编辑状态,Notebook的编辑状态和Jupyter Notebook没有什么区别,主要的界面组成元素有:

  • 代码编辑区:运行代码,也支持Markdown格式;

  • 数据集(Dataset):加载比赛数据集 或 模型 或 库安装代码

  • 运行设置:代码运行配置

    • Environment:运行环境,这个不用动;

    • Accelerator:CPU/GPU/TPU

    • GPU Quota:GPU每周运行时长

    • Internel:是否联网

    • Language:运行语言,Python或者R

8863a12fc235dd76bbd872716725a20d.png

【注意】对于Kernel比赛,必须要从Notebook提交,此时模型预测代码不能联网,所以需要在关闭Internet的情况下完成【库安装】、【模型加载】和【模型预测】。

如果点击Notebook的编辑状态下右上角的【Save Version】按钮,会弹出以下界面。

  • Save & Run All:会把Notebook从零从头运行;

  • Quick Save:将当前的代码状态保存下来;

4a13e8be337242e5f19e5128a32332a4.png

如果点击【Save Version】,选择【Save & Run All】,Notebook会进入运行状态。

可以从屏幕左下角的时钟,看到代码正在运行,Running表示正在运行。如果是Queue表示在运行队列中(一个一个运行),可能之前的Notebook还在运行,可以手动Stop其他的Notebook。

如果Notebook已经提交,可以关闭Notebook编辑页面。打开Notebook的展示页面,可以点击右边的Version 6 of 6,找到提交代码运行信息,此时Notebook是运行状态。

d6fe54880cf3c31bd9e251e51fae8fec.png

当Notebook运行完成,又进入了展示状态。可以在展示状态的Notebook的右边的Output菜单找到代码的输出。点击Submit按钮进行提交,Notebook进入了提交状态。

3a246636a772fc15001c284f8b61a55a.png

在比赛的【My Submission】可以看到提交的Notebook,等到运行完成后就可以得到分数。

Dataset使用

Dataset创建和上传

Dataset是Kaggle提供的用于存放数据和模型的工具,在Kernel赛中模型加载必须从Dataset加载。创建Dataset操作如下所示。

61bd985c40b22f9ec8aa77d59bd10115.png

上传数据需要开代理,不开代理肯定无法上传。

当Dataset创建之后,可以点击右边虚线,然后选择【New version】对数据集进行管理,可以继续上传,也可以删除文件。

83f461b382f43561c0d4b665d0106171.png

Dataset使用

Dataset主要是用来Kernel在不联网时加载模型、安装库。在Notebook的编辑状态,点击右边的【Add data】可以加载Dataset。

add3798e77355b7705737fec6dfebc19.png

  • Dataset:自己的数据集,或者别人数据集。

  • Competition Data:比赛数据。

  • Notebook Output files:Notebook运行后的输出,可以选自己的,也可以选其他人公开的。

68c73f4db3f4fdd33339dc0c0aa88b23.png

当数据集加载后,可以把鼠标放到上面,可以直接复制得到路径。

3f98c95a632f2e60df726ee31df6d6b6.png

注意Dataset路径,不然代码直接报错。

935e9099b296c6f59dd00a5c6dfcfd88.png

Kaggle组队

在比赛的【Team】界面完成,输入其他队伍的名称。

72ff51f764470130c3a8c74b5fb1bfc5.png

Kaggle反作弊机制

作弊行为

  • 私下共享代码,不组队;

  • 私下共享Dataset,不组队;

  • 一台机器或一个IP登陆多个账号;

  • 别人帮我提交代码或CSV;

非作弊行为

  • 跑公开Notebook,提交;

  • 使用其他人公开的Dataset,提交;

所有Kaggle官网能看到的Notebook和Dataset,都是公开的,都可以使用,都不算作弊。

1446d79627dfc47d259da2d704a3b257.jpeg

 
 
 
 
 
 
 
 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值