目标检测之SPP--spatial pyramid pooling layer

SPP-Net通过在卷积层后添加SPP层,解决了目标检测中不同尺寸输入导致的精度问题。它采用多尺度池化,将任意尺寸的特征图转换为固定长度的向量,从而允许直接输入到全连接层。在训练时,使用共享参数的多尺寸网络,而在测试阶段,直接对不同尺寸的图像应用SPP层。SPP层通过max pooling在特征图上形成1x1、2x2、4x4的金字塔结构,输出固定长度的特征向量,有效提高了检测精度。
摘要由CSDN通过智能技术生成

crop就是从一个大图扣出网络输入大小的patch,比如227×227

warp就是把一个边界框bounding box的内容resize成227×227

但warp/crop这种预处理,导致的问题要么被拉伸变形、要么物体不全,限制了识别精确度。没太明白?说句人话就是,一张16:9比例的图片你硬是要Resize成1:1的图片,你说图片失真不?

SPP Net训练和测试的方法基本一样

一张任意尺寸的图片,在最后的卷积层conv5可以得到特征图。根据Region proposal步骤可以得到很多候选区域,这个候选区域可以在特征图上找到相同位置对应的窗口,然后使用SPP,每个窗口都可以得到一个固定长度的输出。将这个输出输入到全连接层里面。这样,图片只需要经过一次CNN,候选区域特征直接从整张图片特征图上提取。在训练这个特征提取网络的时候,使用分类任务得到的网络,固定前面的卷积层,只微调后面的全连接层。

在检测的后面模块,仍然和R-CNN一样,使用SVM和边框回归。SVM的特征输入是FC层,边框回归特征使用SPP层。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值