1、定义
1)从相对尺度定义。目前无统一标准,如边界框面积与图像面积之比的中位数在0.08%~0.58%之间,640像素×480像素分辨率图像中,16像素×16像素到42像素×42像素
2)绝对尺度。coco定义为32像素。因为很多网络如vgg为32倍降采样,最终向量特征点1个像素对应32个像素。
2挑战
1)可利用特征少,分辨率低
2)定位精度要求高,anchor匹配小目标的比大目标少很多
3)数据集中小目标占比少。容易漏标注,标注误差敏感
4)样本不均衡问题。小目标的anchor匹配的正样本较少。
5)小目标聚集问题。多次降采样导致特征聚合、nms过滤掉了、训练难以回归不好收敛
6) 网络结构。设计的网络结构未考虑小目标
3应对策略
1)数据增强
复制小目标、考虑上下文信息进行复制、缩放与拼接、尺度匹配(尺度匹配策略对图像进行尺度变换