深度学习入门笔记:Good Practice in CNN Feature Transfer
这篇paper主要谈到了三个方面:
1)CNN对于输入图像的大小很敏感,因为不同大小的图像在整个下采样的过程中会有不同程度的精度损失。
2) CNN最经常使用的是VGG16,这里就会涉及到对于不同的应用应该使用不同层次的特征使用。主要是因为浅层的更加倾向于抽取局部的特征,对于局部的遮挡会更加敏感。但是对于全连接层的特征--深层的特征更加趋向于刻画全局的特征,这些feature map在classification任务上会取得更好的结果。在pooling5层使用不同的pooling策略会有不同的结果。
3) 该paper没有使用单一规模大小的feature map,而是把不同的层测feature map做了一个合适的fuse,提升了精确度。
最终结果:
使用比较大的输入图像对于不同层的特征进行fuse
在pool5层上使用不同的pool策略