添翼杯人工智能应用创新大赛——环保赛道
题目分析:
- 数据分布:
正、负样本比基本一致
图像长宽比分布在1-1.5
成绩:
初赛a榜:0.97989318 (排名:10)
初赛b榜:0.97814671 (排名:7)
复赛:0.988(排名:4)
方法思路:
- cnn 二分类:使用 se_resnext101_32x4d 作为backbone
- 5折验证:5个model分别对test数据验证,之后进行几何平均
- 数据清洗:
样本类型 | 处理方法 |
---|---|
拼接长图 | 保存为多个子图 |
长图 | 截取目标区域 |
语义不明 | 删除 |
- 数据增强:
对测试集和验证集加入不规则的随机遮挡块
旋转,仿射变换
裁剪得到包括目标的最小外接矩形
总结:
- backbone很重要:该库pretrained-models有很多预训练好的模型,但是往往模型越大,对显卡的要求就越高,如果卡足够好的话,可以使用wsl模型。
- 大的样本尺寸:因为显存限制,我使用了224×224的大小,可以使用更大的尺寸,或者使用动态调整输入尺寸大小的策略。这里需要替换模型的池化层为AdaptiveMaxPool2d或者AdaptiveAvgPool2d
- ensembling:经过我的测试,几何效果的效果比较好,关于ensembling可以看kaggle-ensembling-guide
代码地址:
github地址若觉得本文对你有帮助,点个赞可好~