文章目录
1、kaggle描述
kaggle–开源,如何解决一些数据问题,如何建模解决问题
说明:
不同类别的比赛有不同的目的,1.3难度大
有离线和在线两种
有四种类型
数据挖掘、简单点
图像、语音、自然语言、难点
说明:
kaggle等级
说明:
overview:简介,背景,难点,评估指标,
data:数据集
notebooks:开源的代码,直接导入就可以,应该看一看,可以不用自己写就不要写了
discussion:论坛
leaderboard:排名
A和B榜,要都符合
比赛流程:
baseline选取,完成baseline之后,训练,构建模型推断时需要一些tricks
2、比赛过程实例、
分析数据集、
分析数据样本
可以过滤错误的,
也可以当做噪声去增强泛化能力
评价指标:
MAP:精确率和召回率的权衡
精确率:你识别出来的到底是不是这个目标
召回率:一张图上有100个,只检测出20个,虽然都检测对了
cutout模仿dropout,随机抠掉一些像素,用黑色像素填充
下一种是随机抠掉像素,用其他图的像素填充