kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛）

最新推荐文章于 2025-03-21 11:51:22 发布

Lmenger

最新推荐文章于 2025-03-21 11:51:22 发布

阅读量1.4w

点赞数 8

文章标签：人工智能 python 大数据

本文链接：https://blog.csdn.net/m0_51367120/article/details/126124962

版权

Kaggle

机器学习竞赛、托管数据库、编写和分享代码

安装插件：Header Editor （参考链接见文末）

注册后：首页：

导航栏、搜索栏、社交栏、个人信息

代码查找、下载

数据集下载：

下载全部数据、下载单个数据、命令行(安装pip install kaggle）

代码：

保存至自己的项目

修改项目题目、保存

项目建立、运行、模型保存

上传数据集：

也可以直接拖动文件到空白处上传。有文件夹的情况，压缩再上传。

编写代码：

保存、添加/选择数据集、输入、输出、语言

训练结果（可打开、保存）

机器学习竞赛：

打开任意一个：

Data数据模块：注意数据规模、数据类型，用合适的服务器。kaggle 用户的每个 kernel 可以有 16G 的内存和 4 核CPU，这足够打多数比赛了。另外，提供了 GPU，在新建 kernel 的时候可以选择开启 GPU，但当打开 GPU 时，CPU 和内存资源会少一些。

kaggle 平台上的比赛分4类：挖掘、图像、语音、NLP

Rules ：比赛规则。提交次数：这里会写明每天允许的最大提交次数，一般是5次。另一个是组外私自分享代码和结果，这也是明令禁止的。组队之后队员之间可以分享，或者通过公开的 kernel或discussion区分享。每个队伍最多4个人，并且是可以共享代码。 Kernels ：核心代码。支持 Python 语言的脚本 .py 和 .ipynb，和 R 语言的脚本 .R 和 .ipynb。分 public kernel 和 private kernel。 Discussion ：讨论区。Leaderboard：排名区，分 public LB 和 private LB。比赛方会将 test 数据集中一部分(比如 30%)拿出来做为 public LB 评分和排名，剩下的部分作为 private LB（最终结果）的评分和排名。