triplet loss后面不收敛_【从零开始学习YOLOv3】8. YOLOv3中Loss部分计算

最新推荐文章于 2022-11-20 15:57:40 发布

weixin_39827585

最新推荐文章于 2022-11-20 15:57:40 发布

阅读量508

点赞数 1

文章标签： triplet loss后面不收敛

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39827585/article/details/111346908

版权

本文深入探讨YOLOv3的损失函数计算，包括 Anchor 的选择、偏移量的限制以及损失函数的三个组成部分：bbox loss、obj loss和class loss。详细解析了GIoU的运用以及正负样本的选取策略，揭示了模型训练中收敛的关键因素。

摘要由CSDN通过智能技术生成

YOLOv1是一个anchor-free的，从YOLOv2开始引入了Anchor，在VOC2007数据集上将mAP提升了10个百分点。YOLOv3也继续使用了Anchor，本文主要讲ultralytics版YOLOv3的Loss部分的计算, 实际上这部分loss和原版差距非常大，并且可以通过arc指定loss的构建方式, 如果想看原版的loss可以在下方release的v6中下载源码。

Github地址: https://github.com/ultralytics/yolov3

Github release: https://github.com/ultralytics/yolov3/releases

1. Anchor
2. 偏移公式
3. Loss
4. 代码
5. 补充

1. Anchor

Faster R-CNN中Anchor的大小和比例是由人手工设计的，可能并不贴合数据集，有可能会给模型性能带来负面影响。YOLOv2和YOLOv3则是通过聚类算法得到最适合的k个框。聚类距离是通过IoU来定义，IoU越大，边框距离越近。

Anchor越多，平均IoU会越大，效果越好，但是会带来计算量上的负担，下图是YOLOv2论文中的聚类数量和平均IoU的关系图，在YOLOv2中选择了5个anchor作为精度和速度的平衡。

YOLOv2中聚类Anchor数量和IoU的关系图

2. 偏移公式

在Faster RCNN中，中心坐标的偏移公式是：

其中、代表中心坐标，和代表宽和高，和是模型预测的Anchor相对于Ground Truth的偏移量，通过计算得到的x,y就是最终预测框的中心坐标。

而在YOLOv2和YOLOv3中，对偏移量进行了限制，如果不限制偏移量，那么边框的中心可以在图像任何位置，可能导致训练的不稳定。

公式对应的意义

对照上图进行理解：

和分别代表中心点所处区域的左上角坐标。
和分别代表Anchor的宽和高。
和分别代表预测框中心点和左上角的距离，代表sigmoid函数，将偏移量限制在当前grid中，有利于模型收敛。
和代表预测的宽高偏移量，Anchor的宽和高乘上指数化后的宽高，对Anchor的长宽进行调整。
是置信度预测值，是当前框有目标的概率乘以bounding box和ground truth的IoU的结果

3. Loss

YOLOv3中有一个参数是ignore_thresh，在ultralytics版版的YOLOv3中对应的是train.py文件中的iou_t参数(默认为0.225)。

正负样本是按照以下规则决定的：

如果一个预测框与所有的Ground Truth的最大IoU负样本。
如果Ground Truth的中心点落在一个区域中，该区域就负责检测该物体。将与该物体有最大IoU的预测框作为正样本(注意这里没有用到ignore thresh,即使该最大IoU

在YOLOv3中，Loss分为三个部分:

一个是xywh部分带来的误差，也就是bbox带来的loss
一个是置信度带来的误差，也就是obj带来的loss
最后一个是类别带来的误差，也就是class带来的loss

在代码中分别对应lbox, lobj, lcls，yolov3中使用的loss公式如下：

其中：

S: 代表grid size, 代表13x13,26x26, 52x52

B: box

: 如果在i,j处的box有目标，其值为1，否则为0

: 如果在i,j处的box没有目标，其值为1，否则为0

BCE(binary cross entropy)具体计算公式如下：

以上是论文中yolov3对应的darknet。而pytorch版本的yolov3改动比较大，有较大的改动空间，可以通过参数进行调整。

分成三个部分进行具体分析：

1. lbox部分

在ultralytics版版的YOLOv3中，使用的是GIOU，具体讲解见GIOU讲解链接。

简单来说是这样的公式，IoU公式如下：

而GIoU公式如下：

其中代表两个框最小闭包区域面积，也就是同时包含了预测框和真实框的最小框的面积。

yolov3中提供了IoU、GIoU、DIoU和CIoU等计算方式，以GIoU为例：

if GIoU:  # Generalized IoU https://arxiv.org/pdf/19

最低0.47元/天解锁文章

weixin_39827585

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。