（七）YOLO_v2 论文学习

最新推荐文章于 2023-11-27 17:29:48 发布

负债少女

最新推荐文章于 2023-11-27 17:29:48 发布

阅读量174

点赞数

分类专栏：论文学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37953242/article/details/104751853

版权

论文学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一、目标检测的一些方法

DPM：使用滑动窗口方法，在整个图像上均匀间隔的位置取子窗口并对其进行分类以判别是否包含特定目标
R-CNN：使用区域提案方法首先在图像中生成潜在的边界框，然后在这些建议的框上运行分类器。分类后，后处理用于修正边界框，消除重复检测，并根据场景中的其他对象重新生成框。
YOLO：将目标检测作为回归问题，以往的目标检测都是分类问题。处理过程简单，首先将输入图像缩放成448*448，然后放入单个卷积神经网络，最后根据置信度生成类概率。

二、YOLO v1回顾

优点：

速度快
背景误检率低（处理的是整张图片有全局环境的学习，而fast R-CNN由于没有上下文环境导致背景误检率高）
泛化能力好（在自然图像上训练后测试艺术图像时的准确率比其他的方法高）

缺点：

可以快速检测物体但是精准定位难
小目标物体检测效果差

方法：将图片分成S×S的网格，对每个网格会生成B个边界框，每个边界框由（x,y,w,h,IOU）组成，x和y为边框相对网格的位置，w和h为边框相对整个图片的比例。每个网格有C个类别的概率预测Pr(Class_i∣Object)，这与边界框无关，这些概率只当类别目标的中心的落入网格中才做计算。预测的过程中将类预测和边框预测相乘得到每个边界对特定类别的置信度。这个编码预测需要一个【S×S×(B×5+C)】的Tensor。
在这里插入图片描述

参考博客mark

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。