cvpr 代码
1.小目标检测需要高分辨率
可以提高输入分辨率
SSD对高分辨率的底层特征没有再利用,但底层特征的语义信息少,这两个互相矛盾。
另外SSD的anchors设计为0.1~0.2,最小的anchors大小为72,还是太大了。
2.feature map不能太小
卷积网络的最后一层的feature map不能太小。卷积网络越深,语义信息越强,越底层是描述局部外观信息越多。
3.可以多尺度检测
4.多尺度特征表示
解决小目标检测问题的一般方法:提高输入图像的分辨率,会增加运算量;多尺度特征表示,结果不可控
全卷积网络:
FCN可以接受任意尺寸的输入图像,与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类(全联接层+softmax输出)不同。采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。
CNN的强大之处在于它的多层结构能自动学习特征,并且可以学习到多个层次的特征:
较浅的卷积层感知域较小,学习到一些局部区域的特征
较深的卷积层具有较大的感知域,能够学习到更加抽象一些的特征
高层的抽象特征对物体的大小、位置和方向等敏感性更低,从而有助于识别性能的提高, 所以我们常常可以将卷积层看作是特征提取器
将全连接层转为卷积层:
将滤波器的尺寸设置为和输入数据体的尺寸一致, 这样输出就变为, 本质上和全连接层的输出是一样的