目标检测入门——YOLO系列

最新推荐文章于 2023-10-19 08:28:09 发布

莉总的猹

最新推荐文章于 2023-10-19 08:28:09 发布

阅读量215

点赞数 1

文章标签：目标检测 YOLO 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57949473/article/details/132963575

版权

总述

two-stage：从图像中提取若干候选框，然后逐一对候选框进行甄别，候选框可能变为预测框。代表作：RCNN、FastRCNN fasterRCNN

候选框称为regions for interest (ROI)，选择候选框的过程称为region proposal

one-stage:不需要提取候选框，直接把图像喂到模型里面，模型就输出目标检测结果，不需要候选框不需要甄别，代表作：YOLO，SSD，RetinaNet

YOLOv1

相比于fast R-CNN候选框只是图像中的一小部分，丢失了与背景和全景的关系，YOLO使用全图one-stage解决该问题

预测阶段

在YOLOv1中把固定大小的输入图像划分为7*7个grid cell，每个grid cell预测2个bounding box，每个bounding box的中心点落在grid cell里面，bounding box由（x,y,h,w,c）表示，其中c表示置信度即下图中框的粗细程度。而每个grid cell 预测一组条件类别的概率。最后候选框的置信度×类别条件概率就可以得出最终的框以及框中物体类别

具体来说如何获取到置信度和条件概率呢？

答：通过YOLO网络结构可以得到7*7*30 tensor，其中7*7就对应将图片切成7*7的grid cell，而30=（5*2+20），其中5*2 代表每个grid cell生成1个bounding box而每个bounding box又有5个参数

上图可以看出，7*7*30的结构每个grid cell的通道中包含了其2个bounding box的参数和其自身类别。从而可以得到所有候选框及其类别然后再根据置信度过滤和NMS去除多余框

同样的，我们也能发现YOLOv1的缺陷：其划分的每个grid cell只能代表一种类别，那么当遇到小目标（目标大小小于grid cell）的时候效果很差。

训练阶段

预测阶段中最重要的就是7*7*30 tensor，他包含了候选框所有信息，那么他是如何训练得到的？

标注好的图像中真实框中心点落在哪个grid cell中就应该由哪个grid cell预测出的bounding box去拟合（grid cell预测出的有两，选IOU大的去拟合）

若真实框没有中心点落的grid cell，则其预测的bounding box让其置信度c越接近0越好

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

莉总的猹 CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

135万+: 周排名

13万+: 总排名

6205: 访问

: 等级

119: 积分

24: 粉丝

30: 获赞

15: 评论

75: 收藏

私信

关注

热门文章

最新评论

YOLOv8_obb——旋转目标检测无敌大还丹（DOTA数据集）
NNNOBug: 朋友，请问这个问题你解决了吗？我也是训练出来的模型是hbb
YOLOv8_obb——旋转目标检测无敌大还丹（DOTA数据集）
DYF-AI: 方法二确实图片和标签数据量没对上
YOLOv8_obb——旋转目标检测无敌大还丹（DOTA数据集）
Fre$h Oxygen: 请问使用obb检测的过程中，loss损失函数不需要修改吗？
YOLOv8_obb——旋转目标检测无敌大还丹（DOTA数据集）
qq_43732982: 大佬，求一份转好的yolo格式数据集
YOLOv8_obb——旋转目标检测无敌大还丹（DOTA数据集）
wtfcrazy: 为什么我用这个函数转yolo的txt，出现以下的问题，没有生成新的txt serWarning: On January 1, 2023, MMCV will release v2.0.0, in which it will remove components related to the training process and add a data transformation module. In addition, it will rename the package names mmcv to mmcv-lite and mmcv-full to mmcv. See https://github.com/open-mmlab/mmcv/blob/master/docs/en/compatibility.md for more details. warnings.warn( IoU: -5.316205024719238 Processing train images: 100%|██████████| 38/38 [00:00<?, ?it/s] Processing val images: 100%|██████████| 3/3 [00:00<?, ?it/s] Process finished with exit code 0

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。