YoloV1算法

最新推荐文章于 2024-08-25 18:17:58 发布

α2022

最新推荐文章于 2024-08-25 18:17:58 发布

阅读量155

点赞数

文章标签：算法 YOLO 计算机视觉

本文链接：https://blog.csdn.net/weixin_43781113/article/details/130293506

版权

来源:B站霹雳吧啦Wz

学习路线

网络讲解
读原文
跑作者代码
分析代码：网络搭建，数据处理，损失计算

生成bbox

1)将一幅图像分成SxS个网格(grid cell),如果某个object的中心落在这个网格中，则这个网格就负责预测这个object。
2)每个网格要预测B个bounding box，每个bounding box除了要预测位置之外，还要附带预测一个confidence值。每个网格还要预测c个类别的分数。
S = 7 B = 2 C= 20 30个channel
xywh均为相对值，（0，1）
confidence：可以理解为Pr(Object) * IoU,Pr(Object)取0或者1，有无目标
$\operatorname{Pr}\left(\right. Class_{i} \mid Object) * \operatorname{Pr}(Object) * \mathrm{IOU}_{\text {pred }}^{\text {truth }}=\operatorname{Pr}\left(\right.Class\left._{i}\right) * \mathrm{IOU}_{\text {pred }}^{\text {truth }}$

网络结构

损失函数

bounding box损失
$\begin{array}{l}\lambda_{\text {coord }} \sum_{i=0}^{S^{2}} \sum_{j=0}^{B} \mathbb{1}_{i j}^{\text {obj }}\left[\left(x_{i}-\hat{x}_{i}\right)^{2}+\left(y_{i}-\hat{y}_{i}\right)^{2}\right] \quad+\lambda_{\text {coord }} \sum_{i=0}^{S^{2}} \sum_{j=0}^{B} \mathbb{1}_{i j}^{\text {obj }}\left[\left(\sqrt{w_{i}}-\sqrt{\hat{w}_{i}}\right)^{2}+\left(\sqrt{h_{i}}-\sqrt{\hat{h}_{i}}\right)^{2}\right]\end{array}$
后面开根号为了提升小目标的检测效果，若不改变，偏移相同距离误差一样大，是不合理的。应该小目标的更大一些

confidence损失
$\begin{array}{l}+\sum_{i=0}^{S^{2}} \sum_{j=0}^{B} \mathbb{1}_{i j}^{\text {obj }}\left(C_{i}-\hat{C}_{i}\right)^{2} +\lambda_{\text {noobj }} \sum_{i=0}^{S^{2}} \sum_{j=0}^{B} \mathbb{1}_{i j}^{\text {noobj }}\left(C_{i}-\hat{C}_{i}\right)^{2}\end{array}$
前面计算正样本损失，后面计算负样本损失
classes损失
$+\sum_{i=0}^{S^{2}} \mathbb{1}_{i}^{\text {obj }} \sum_{c \in \text { classes }}\left(p_{i}(c)-\hat{p}_{i}(c)\right)^{2}$