前言
1.本文重点是SPP(Spatial Pyramid Pooling)以及特征图和原图的映射关系,尽量用较少篇幅表达清楚论文算法,其他一些不影响理解算法的东西不做赘述
2.博客主要是学习记录,为了更好理解和方便以后查看,当然如果能为别人提供帮助就更好了,如果有不对的地方请指正(论文中的链接是我经过大量搜索,个人认为讲解最清楚的参考)
创新点
1.改进R-CNN中的cnn前向传播,对整张图进行一次特征提取,加速运算速度,提出了权重共享的策略
2.提出Spatial Pyramid Pooling
问题引出
1.R-CNN存在的问题
1)R-CNN中每张图片经过selective search生成2000个候选框,然后把框内图片抠出来输入网络,这样每张图片就会进行2000次cnn前向传播,导致重复计算,计算量非常大而且没必要
2)输入网络之前还要把每个抠出来的部分缩放成统一尺寸以满足全连接层,物体会发生形变扭曲,失去特征信息的真实性。
2.SPP Net的解决方法
1)对于第一个问题
将一张图片输入网络进行特征提取得到特征图,然后将候选框与特征图结合ÿ