kaggle小白

如何入门一场比赛

(Description)当进入到一场比赛的Overview页面后,先读完Description了解比赛讲了一件什么事情。Timeline随便看一下好了,知道什么时候停止组队和什么时候结束就行。注意这里是UTC-0的时间,比北京时间迟8小时。这里主要看一下run-time的限制,Run-time代表你的代码最大运行时间。一般都是9个小时,但有些比赛会不一样

(Data)之后进入Data页面,这里每一行都要仔细吧,每份csv文件里的每个字段都会有解释的,很多细节甚至会影响到比赛的打法。

(Discussion)看完了官方的介绍后,一般我们可以先进入Discussion区, 最上面的 pined topics 是官方的置顶的话题,比较重要,往 往是官方在比赛过程中发现了一些问题后,做出的调整。

(code)看完pined topics后,可以先回到code区,可以按votes序。找一些关键词例如: EDA(数据探索)、 Starter(适合刚参加比赛)、 Baseline(基线模型), 里面有大神对数据做了基本分析,而且往往有很多图表,有助于你进一步理解数据,如数据分布是否有类别不平衡的问题,之类的。

读完比赛规则和看完一些EDA后,对比赛已经有一个初步了解了。这时候,就可以在Code区找一些Baseline认真阅读 一下,或者找一些高分的(按score排序)code运行、提交一下了。
这里我推荐几篇Baseline,包括了各种主流框架、模型 在计算机术语中,基线(Baseline)是软件文档或源码(或其它产出物)的一个稳定版本,它是进一步开发的基础
RSNA Fracture Detection - in-depth EDA: RSNA Fracture Detection - in-depth EDA
RSNA Efficient-net Baseline: RSNA Efficient-net Baseline
PyTorch-EffNetV2 baseline CV:0.49: PyTorch-EffNetV2 baseline
RSNA2022 Cervical Baseline: RSNA2022 Cervical Baseline

 

如何成为Kaggle Contributor

要参加比赛,先要按照Kaggle官方要求,成为Contributor 要完成以下四项任务

  1. Run 1 notebook or script (运行一次方案或者脚本)

  2. Make 1 competition submission(完成一次竞赛提交)

1和2 两项详见“Kaggle方案提交教程”

  1. Make 1 comment (完成一次评论)

  2. Give 1 upvote (完成一次点赞)

3和4 两项则很轻松可以完成。进入Kaggle任意主题讨论区,完成一次评论和点赞即可。

例如:

操作1 完成点赞

操作2 完成评论。首次评论要手机接收验证码,要开vpn

情况1 : 首次注册需要手机验证

手机验证操作如下

Kaggle方案提交教程

Kaggle严禁不同队伍之间,私下分享未公开的代码,Kaggle有非常严厉的检测手段!

但 Kaggle 支持大家在平台上合规地共享代码,因此可以大胆使用别人共享的公开代码

究竟怎么操作呢?

  1. 首先,找到一些分数比较高的公开方案。

进入竞赛中的 Code 选项,在选择Hotness 中的 Best Score。

  1. 其次,确认该方案是否适合上传。

在Notebook中查看相应的代码情况

  • RUN 运行时间

  • Public Score 运行分数

  • 确认Data的数据集中都是公开的数据集

  1. 选好方案后,进行方案上传提交

步骤1. 点击 Copy & Edit

步骤2. 直接 Save Version

步骤3. 确认 Save

步骤4. 查看现在正在运行的版本

步骤5. Go to Viewer

步骤6. 等待代码运行结束

步骤7. 这是代码运行成功后的样子

步骤8. 提交结果

步骤9. 确认提交

步骤10. 去比赛主页,查看提交的分数

### 下载Kaggle图片数据集的方法 #### 准备工作 为了能够顺利下载Kaggle上的图片数据集,首先需要完成账号注册以及手机号验证。这一步骤至关重要,因为只有通过验证后的账户才能访问和下载数据集[^2]。 #### 获取API Token 登录个人的Kaggle账户后,在"My Account"页面中找到`Create New API Token`按钮来获取用于身份认证的JSON文件——即`kaggle.json`。此文件包含了必要的鉴权信息以便后续调用API接口时使用[^3]。 #### 安装Python库 安装官方提供的Python客户端工具包对于简化操作流程十分有帮助。可以通过pip命令轻松实现这一目标: ```bash pip install kaggle ``` #### 配置环境变量 确保已将刚才获得的`kaggle.json`放置于正确的位置下: - 对于MacOS/Linux用户而言,应将其置于`~/.kaggle/`目录内; - Windows用户的路径则应该是`C:\Users\<YourUsername>\.kaggle\`[^4]。 #### 使用CLI指令下载特定的数据集 假设想要下载名为“dogs-vs-cats”的图像分类挑战赛中的训练样本,则可以在终端执行如下命令: ```bash kaggle competitions download -c dogs-vs-cats ``` 如果仅需某个具体版本的数据子集而非整个比赛资料,也可以指定相应的参数来进行精准拉取。例如针对某位作者分享出来的公开资源集合,可采用以下方式获取: ```bash kaggle datasets download -d username/datasetname ``` 以上就是完整的从准备阶段到最后实际取得所需素材的一系列步骤说明。值得注意的是,部分大型数据集可能会占用较多网络带宽及时长,请耐心等待直至过程结束。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值