目标检测复盘 --4. Faster RCNN

ShyHG

于 2023-05-21 20:29:40 发布

阅读量502

点赞数

分类专栏： ML/DL 自动驾驶相关文章标签：目标检测深度学习计算机视觉

本文链接：https://blog.csdn.net/weixin_45348389/article/details/130775302

版权

18 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

在这里插入图片描述

Fast RCNN的性能得到了很大的提升，但是还是有很大一部分开销在候选框的生成模块，也就是SS算法，Faster RCNN使用一个网络专门干这个事，从而加快整体检测速度，能达到5帧每秒。
所以这里的FasterRCNN也就是RPN+FastRCNN
RPN，这里参考 https://blog.csdn.net/m0_63007797/article/details/127704034
流程：
1. 常规卷积提取特征获取feature map
2. 利用3*3，个数为256，stride=1,paddling=1的卷积核作为sliding window来卷积，得到H*W*256的特征图，对每个点的256维向量分别所两次全连接操作获得图中的2k scores和4k coordinates，论文中k=9
3. 映射到特征图上，接入Fast RCNN步骤

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

分类损失，是一个sofrmax cross entropy
举例：第一个位置的损失 $L_{cls}=-log(0.9)$ 第二个位置的损失是 $L_{cls}=-log(0.2)$ ，图中的标签可以onehot为[1,0],[0,1]…

在这里插入图片描述

pytorch中的实现采用下面这个版本，是下图中的实现方法，分类损失采用二值交叉熵
使用sigmoid输出K个值，而不是上图中的2K，同样计算一下，第一个位置为 $L_{cls}=-[log(0.9+(1-1)*log(1-0.9)]$ ，第二个位置为 $L_{cls}=-[0*log(0.2)+(1-0)log(1-0.2])$