1. 数据:
- 数据研究:是如何获得的,宽高比,类别平衡,采样环境
- 标注框和感受野的设置,rpn中anchor ratio,大目标和小目标
- 考虑训练集和测试集的分布
- 数据集的划分
- 直接比列
- 分层抽样,考虑类别的分布
- domain,根据数据集的分布,两个不同的年代
- k折划分
2 模型
backbone,Neck(FPN),RoIHead,它级联三个不同IOU阈值(0.5,0.6,0.7)的头,但在2019广东工业智造创新大赛决赛上,某团队针对评测mAP要求的IOU阈值0.1、0.3和0.5,降低了级联的阈值至0.4、0.5和0.6,从而获得了提升,说明宽松评测下,级联头阈值可适当减低以获取更多的预测框,这种方式可能会提升性能。另外,在天池”重庆大赛-瓶装白酒疵品质检”里,好像也还有选手通过增加多一个head,在某种程度上帮助模型更好的拟合数据,但不一定在每个赛题数据上都起作用。
3. 训练
-
数据增强 (Albu很强大) 还可以分为在线和离线
i. 空间
ii. 噪声变换
iii. 遮挡或者重叠------cutout, mixup
iv. 过采样----类别不平衡------》copy-paste,泊松融合
v. 图像模糊
vi. 标签平滑,色调归一化,Albumentation -
训练尺度,尽量越大越好,提高短边上线能够带来提升,测试尺度,使用TTA
-
学习率,soft-nms等超参数
-
混合精度训练
4. 模型融合+后处理
- 交叉验证后,不同迭代次数的,线性融合,不同初始化方式
- 直接合并,将A模型检测的a类的结果+B模型检测的b类的结果合并
- WBF:权重框融合Weighted Boxes Fusion,例如在visdrone2021比赛中,第一名使用分层nms,score大于0.1的用WBF,小于 0.1的用soft-nms, 见下方连接https://mp.ofweek.com/ai/a756714902267
- 多尺度bbox目标检测融合
https://blog.csdn.net/qq_33031419/article/details/106782837
写这篇文章主要是用于回顾总结下比赛的一般性技巧,由于我的经验也不是很高,高度不太够,水平很垃圾,所以认识也不是很高,不过希望自己能够对比赛有一个整体上的认识,记录之
参考
【1】https://jishuin.proginn.com/p/763bfbd5a357
【2】https://mp.ofweek.com/ai/a756714902267