针对Faster RCNN具体细节以及源码的解读之SmoothL1Loss层

最新推荐文章于 2024-01-05 12:42:54 发布

xyy19920105

最新推荐文章于 2024-01-05 12:42:54 发布

阅读量2.6w

点赞数 7

分类专栏：深度学习目标检测源码分析 faster rcnn 文章标签： FasterRCNN 源码 object-det

本文链接：https://blog.csdn.net/xyy19920105/article/details/50421225

版权

深度学习同时被 3 个专栏收录

7 篇文章 0 订阅

订阅专栏

目标检测

7 篇文章 0 订阅

订阅专栏

源码分析

3 篇文章 0 订阅

订阅专栏

本文深入解读Faster RCNN中的SmoothL1Loss层，探讨其在目标检测中的作用和优势。通过分析源码，理解其计算过程，并对比论文中的描述，解释了通用版本的实现。同时，文中还提及了权重的使用及其对loss的影响，以及在Backward过程中的梯度计算。

摘要由CSDN通过智能技术生成

从今天开始，阅读faster rcnn的相关代码，并记录我对faster rcnn中特别的层的理解。本篇主要是对smooth_L1_Loss层进行解读。
RBG大神认为CPU版本的太慢了，故有些操作CPU版压根就没有实现。smooth_L1_Loss是Faster RCNN提出来的计算距离的loss，文章中提到对噪声点更加鲁棒。
输入四个bottom，分别是predict，target，inside_weight, outside_weight.与论文并不完全一致，代码中实现的是更加general的版本。
公式为：

$output = w_{out} * Smooth_{l1}(x_{new})$
$Smooth_{l1}(x) = 0.5 * (\sigma * x)^2$ or $Smooth_{l1}(x) = |x| - 0.5/\sigma^2$
$x_{new} = x_{old}* w_{in}$

LayerSetup
就是对记录相关参数并计算 $\sigma^2$ ，并判断是否含有weights.
Resharp
就是针对diff_ , errors_ , ones_,进行reshape
Forward
先计算 $w_{in}*(b_0 - b_1)$ ，再计算 $w_{out} * Smooth_{l1}(w_{in} * (b_0 - b_1))$ ，最终将所有值加起来除以num得到loss。
Backward
backward的公式并不麻烦，公式如下：

$Smooth_{l1}'(x) = \sigma^2 * x$ or $Smooth_{l1}'(x) = sign(x)$
$\frac{\delta loss}{\delta b_0} = w_{out} * w_{in} * Smooth_{l1}'(w_{in}*(b_0-b_1))$
$\frac{\delta loss}{\delta b_1} = -w_{out} * w_{in} * Smooth_{l1}'(w_{in}*(b_0-b_1))$
直接按照公式去做即可，不过有那么一点点不明白的地方，就是为什么对 $b_1$ 也求偏导呢？？可能在看了AnchorTargetLayer层之后就会得到答案。