如何开始Kaggle


前言

Kaggle是全球最大的数据科学平台。其中比赛含金量很高。笔者与小伙伴们刚开始进行Kaggle,遇到了一些问题,于是写出这篇文章,以帮助读者避免我们遇到过的问题。


一、Kaggle的注册

要开始Kaggle竞赛,首先需要有一个Kaggle账号,Kaggle平台的链接在右边蓝色字体。 Kaggle平台

打开后的界面如下:在这里插入图片描述
这里提供了Register with Google和Register with Email两个选项,任选一个进行注册就OK了。

二、Join第一个Kaggle比赛

注册完了以后登陆Kaggle。会有如下界面。
在这里插入图片描述

在右边能看到你在Kaggle的活跃天数,贡献的数据集、参与的讨论、参加的比赛和课程。后面多用就明白具体是什么意思了。

在左边单机"Competitions"就能找到比赛。选择你想要的比赛并打开。新手建议找到Getting Started的Titanic号开始。

在这里插入图片描述
类似于这个界面,单机右上角就能加入比赛了。另外,官方也有详细的文档来介绍Kaggle比赛以及如何提交,本文只是更详尽一些以及强调一下之前笔者犯过的错误,让后来者少踩坑。点击右方蓝色字体快速跳转。 官方文档


三、Kaggle数据的下载与结果的提交

官方同样有详细的文档教程如何提交,点击右方蓝色字体快速跳转。 提交教程

刚入门Kaggle或者一些对Kaggle完全不了解的朋友可能不太了解Kaggle提交具体是要提交什么。这里大概说明一下,Kaggle的提交只需要提交一个包含预测结果的数据文件即可,并不需要提交代码,更不需要像数学建模一样提交论文。它的评分机制是根据你提交的结果,和它的真实结果,计算准确率、F1分数等衡量预测结果好坏的指标,然后给出相应的评分。部分比赛会有较为详细的说明。接下来将以Titanic号为例详细说明如何提交。

  1. 方式1,在本地运行完相应的代码以后,或者通过任意方式得到预测结果文件以后,到如下界面。

在这里插入图片描述

单击右上角"Submit Prediction",进入如下界面。

在这里插入图片描述

将文件直接拖进去或者点击"Browse Files",在文件资源管理器找到相应文件提交即可。

Tips:如果要在本地运行代码,得先下载数据集。还是之前的界面,点击Data。
在这里插入图片描述
将界面移动到最最最下方。
在这里插入图片描述
点击右边Download All就可以下载所有数据集了。

  1. 方式2,在Kaggle上建立Notebook,并输出,官方提供的代码如下。
output = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': predictions})
output.to_csv('submission.csv', index=False)
print("Your submission was successfully saved!")

在下图中,单击右上角黑色方框中的"Save Version"。

在这里插入图片描述
选择"Save & Run All(commit)“。并单机右下角"Save”。

在这里插入图片描述
然后左下角就可以开始运行了!运行完后,会有…出现,点它,再点Open In Viewer。
在这里插入图片描述

进入如下界面,点击"Output"。

在这里插入图片描述

这里就有你预测的结果。可以顺便检查一下数据集。单击"Submit"进行提交。

在这里插入图片描述

!!!!!!!!!!!
这里有些需要注意的点

  1. 提交结果格式要完全一致,数据类型要完全一致,比如我上面有张图Survived列是小数,这样会导致得0分的,必须是整数!!!
  2. "PassengerId"和"Survived"这两列仔细核对,不要拼错了!包括大小写。
  3. 在写代码时,output.to_csv()中的index必须是"False",否则数据表中会多出一列来。
  4. 同理的,结果数据表千万不要多出其他列
    这里有些需要注意的点
    !!!!!!!!!!!

四、如何查看你的排名

提交了以后,回到比赛的主页。点击"Leaderboard"。

在这里插入图片描述
单击Jump to your leaderboard position。就可以查看你的排名了。
在这里插入图片描述

另外,如果想查看排名前百分之几,可以在Competitions的界面,找到Your Active Competitions。将鼠标停留在你的排名那。

在这里插入图片描述
可以看到,笔者目前排名前15%,还只是个菜鸟。

总结

OK!现在开始,Enjoy your Kaggle!

  • 30
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值