yolo理论合集

ChunyeLi

已于 2022-02-27 23:59:57 修改

阅读量991

点赞数

分类专栏：深度学习文章标签：目标检测人工智能计算机视觉

于 2022-02-27 17:11:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_32512123/article/details/123166172

版权

深度学习专栏收录该内容

28 篇文章 3 订阅

订阅专栏

文章目录

yolo1
yolo2
yolov3
yolov3 spp （包括CIoU 和Focal Loss）

https://github.com/WZMIAOMIAO/deep-learning-for-image-processing

yolo1

在这里插入图片描述

xy是小网格中的，(0,1)
w,h是整个图像中的，(0,1)
confidence=bounding box是否含有object×预测的与gt之间的iou。

为每个目标的概率+预测的目标边界框和真实的目标边界框的重合程度。
在这里插入图片描述

为什么w和h要根号？
假设蓝色为预测的边界框，绿色为真实边界框。
假设目标越小，预测的边界框与真实边界框偏移相同的情况下，IOU就越大，检测效果越差。
所以应该要让小目标的偏差设的更大一些。
在这里插入图片描述

confidence损失的前一项是正样本（C=1）的损失计算，后者是负样本的（ C=0）。

YOLOv1存在的问题：
1.因为每个cell只预测一组类别，所以对群体聚集的小目标检测结果较差。
2.输入尺寸变化时，检测效果较差；
3.定位不准确。（因为直接预测坐标信息）
在这里插入图片描述

yolo2

在这里插入图片描述
class大于9000

采用anchor偏移的方式，recall提升较高，map略微上升

在这里插入图片描述

在这里插入图片描述

t_0是confidence，也受到sigmoid限制。

高层和底层信息融合，为了更好提取细节信息。

在这里插入图片描述
每10个batch，就随机输入网络的图片尺寸（32的倍数）。

用224是为了方便对比。

yolov3

在这里插入图片描述

在这里插入图片描述

用了新的backbone，效果持平同时fps也比较高。和resnet相比，没有最大池化层，而是用了卷积。

http://blog.csdn.net/qq_37541097/article/details/81214953

在这里插入图片描述

yolov3 spp （包括CIoU 和Focal Loss）

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

A^c是蓝色框，u是并集。GIoU在两者不相交时也可提供损失。

在这里插入图片描述

CIoU(D)是将C计算IoU时把其换成DIoU

在这里插入图片描述
负样本挖掘没focal loss好。

在这里插入图片描述
正负样本。

难易样本。
右边曲线表示:
p_t越大，就表示越容易分类。这部分就降低其权重。
越小，表示越难分类，这部分就提高其权重。

这里的α是用来平衡γ的（平衡套娃）。

前两者都是易分样本，所以权重降低比较好。

前提：数据标注要正确。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。