SSD源码解析4-损失函数（理论+源码）_ssd损失函数(1)

最新推荐文章于 2024-08-31 17:46:11 发布

蛋黄酥呀

最新推荐文章于 2024-08-31 17:46:11 发布

阅读量393

点赞数 3

文章标签：运维 linux 面试

本文链接：https://blog.csdn.net/AUZKAY/article/details/138982288

版权

最全的Linux教程，Linux从入门到精通

======================

linux从入门到精通(第2版)
Linux系统移植
Linux驱动开发入门与实战
LINUX 系统移植第2版
Linux开源网络全栈详解从DPDK到OpenFlow

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷，并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本，循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘，内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件，供读者免费下载。

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读，同时也非常适合准备从事Linux平台开发的各类人员。

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以点击这里获取！

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

SSD源码简单版

看了一下两个版本的代码，如上面链接所示，

**简单版，**代码和之前解析的源码类型是一致的，更容易理解些，但是只有预测部分而没有训练部分。虽然能很容易理解，但里面没有标签处理，损失计算等部分。即使看懂了，也有种啥都没学到的感觉。

复杂版，当时看到这个源代码是有点懵的，为啥呢？因为看不懂啊，之前没见过用这种方式写的代码，套路不太一样。反反复复犹犹豫豫了好几次，想着要不要花点精力看复杂版的，也尝试在github上搜了一下看看有没有更合适的版本，结果是并没有，所以就硬着头皮解析这个比较复杂的代码了。前期是先跳过了看不懂的部分，直接去看网络构建部分，anchor生成部分，计算损失部分，数据预处理部分，但是整体运行逻辑还是有点懵。后来看了一点有关TensorFlow的Estimator讲解，稍微有点眉目，但是还不是很了解，有点不知所以然。主要是Estimator的方式不太习惯，如果只把他当作一种框架，你按它固定的格式传入相应的参数就行，还可以接受些。具体的网络搭建，anchor创建，损失计算等和之前还是一样的。

SSD损失函数

相比较YOLOv3，SSD的损失函数相对直观些，这次就不贴手写的了，因为要贴损失计算实现的代码，手写太费事了。

SSD损失函数定义为**位置误差（locatization loss， loc）与置信度误差（confidence loss, conf）**的加权和（实际代码中还会加上l2_loss以防止过拟合）：

其中 $N$ 是先验框的正样本数量。这里 $x_{ij}^{k}\varepsilon {1,0}}$ 为一个指示参数，当** $x_{ij}^{k}=1$ 时表示第i 个先验框与第j 个ground truth匹配**，并且ground truth的类别为 p 。 c 为类别置信度预测值。 $l$ 为先验框的所对应边界框的位置预测值，而 g 是ground truth的位置参数。

下面盗一张图再来说明一下：

1，对于位置误差

其采用Smooth L1 loss，定义如下：

由于 $x_{ij}^{k}$ 的存在，所以位置误差仅针对正样本进行计算。值得注意的是，要先对ground truth的g 进行编码得到 $\hat{g}$ （偏移量），因为预测值 $l$ 也是编码值，若设置variance_encoded_in_target=True，编码时要加上variance=[0.1, 0.1, 0.2, 0.2]：

上面公式在实际代码中的操作如下（encode_all_anchors()函数中）：

            gt_cy = (gt_cy - anchor_cy) / anchor_h / self._prior_scaling[0]  # [0.1, 0.1, 0.2, 0.2]
            gt_cx = (gt_cx - anchor_cx) / anchor_w / self._prior_scaling[1]
            gt_h = tf.log(gt_h / anchor_h) / self._prior_scaling[2]
            gt_w = tf.log(gt_w / anchor_w) / self._prior_scaling[3]

smooth_l1的公式如下，实际计算中x=g-l，g为ground_truth，l为预测值。

其中smooth_l1的代码实现如下：

'''
smooth_l1损失
'''
def modified_smooth_l1(bbox_pred, bbox_targets, bbox_inside_weights=1., bbox_outside_weights=1., sigma=1.):
    """
        ResultLoss = outside_weights * SmoothL1(inside_weights * (bbox_pred - bbox_targets))
        SmoothL1(x) = 0.5 * (sigma * x)^2,    if |x| < 1 / sigma^2
                      |x| - 0.5 / sigma^2,    otherwise
    """
    with tf.name_scope('smooth_l1', values=[bbox_pred, bbox_targets]):
        sigma2 = sigma * sigma

        inside_mul = tf.multiply(bbox_inside_weights, tf.subtract(bbox_pred, bbox_targets))

        smooth_l1_sign = tf.cast(tf.less(tf.abs(inside_mul), 1.0 / sigma2), tf.float32)
        smooth_l1_option1 = tf.multiply(tf.multiply(inside_mul, inside_mul), 0.5 * sigma2)  # 0.5x^2
        smooth_l1_option2 = tf.subtract(tf.abs(inside_mul), 0.5 / sigma2)  # |x|-0.5
        smooth_l1_result = tf.add(tf.multiply(smooth_l1_option1, smooth_l1_sign),
                                  tf.multiply(smooth_l1_option2, tf.abs(tf.subtract(smooth_l1_sign, 1.0))))

        outside_mul = tf.multiply(bbox_outside_weights, smooth_l1_result)

        return outside_mul

实际程序中计算smooth_l1损失的代码如下（其中location_pred是预测边框的编码值，flaten_loc_targets是标记边框的编码值）：

    #*******预测框回归smooth_l1损失
    loc_loss = modified_smooth_l1(location_pred, flaten_loc_targets, sigma=1.)    # 这时是框坐标的偏移量
    loc_loss = tf.reduce_mean(tf.reduce_sum(loc_loss, axis=-1), name='location_loss')
    tf.summary.scalar('location_loss', loc_loss)
    tf.losses.add_loss(loc_loss)

2，对于置信度误差

其采用softmax loss:

权重系数 $\alpha$ 通过交叉验证设置为1。

实际程序中对应的代码如下（其中flaten_cls_targets是类别标记值，cls_pred是预测类别值）：

    # 分类的交叉熵损失，并乘以权重系数3+1
    cross_entropy = tf.losses.sparse_softmax_cross_entropy(labels=flaten_cls_targets, logits=cls_pred) * (params['negative_ratio'] + 1.)
    # 创建一个名为cross_entropy_loss的张量用于记录。
    tf.identity(cross_entropy, name='cross_entropy_loss')
    tf.summary.scalar('cross_entropy_loss', cross_entropy)

3，l2_loss

在实际代码中，为了防止过拟合，加入了l2_loss（l2_loss一般用于优化目标函数中的正则项，防止参数太多复杂容易过拟合）。

不过正常的l2范数是求变量平方和再开根号，但是实际代码中并不是完全这样做的，而是求变量平方和的一半。

    # l2_loss一般用于优化目标函数中的正则项，防止参数太多复杂容易过拟合
    # l2 计算模型中所有可训练变量（除了带_bn和conv4_3_scale的变量）的l2范数（变形版，求平方和的一半）,l2范数是求平方和开根号
    l2_loss_vars = []
    for trainable_var in tf.trainable_variables():
        if '_bn' not in trainable_var.name:
            if 'conv4_3_scale' not in trainable_var.name:
                l2_loss_vars.append(tf.nn.l2_loss(trainable_var))   #tf.nn.l2_loss 利用L2范数来计算张量的误差值，output = sum(t^2)/2
            else:
                l2_loss_vars.append(tf.nn.l2_loss(trainable_var) * 0.1)

4，total_loss

total_loss是将上面的loc_loss，cross_loss，l2_loss_vars相加得到整个模型的损失。

total_loss=cross_loss+loc_loss+weight_decay*l2_loss_vars

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以点击这里获取！

蛋黄酥呀

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
SSD源码解析4-损失函数（理论+源码）_ssd损失函数(1)

最全的Linux教程，Linux从入门到精通第一份《Linux从入门到精通》466页内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷，并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本，循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘，内容为本书配套多媒体教学视频。
复制链接

扫一扫