目标检测概述-中篇

Peyzhang

已于 2022-08-14 22:53:35 修改

阅读量848

点赞数

文章标签：目标检测人工智能计算机视觉

于 2022-08-01 22:17:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Peyzhang/article/details/126111181

版权

YOLO

使用单个神经网络，在一次评估中直接从完整图像上预测边界框和类别概率。由于整个检测流程仅用一个网络，所以可以直接对检测性能进行端到端的优化。

YOLO结构： ---- GoogleNet + 4个卷积 + 2个全连接层

1、把图像缩放到448X448
2、在图上运行卷积网络
3、根据模型的置信度对检测结果进行阈值处理

在这里插入图片描述

输出7 * 7 * 30 的理解

单元格（cell）

7 x 7=49个像素值，理解成49个单元格，每个单元格可以代表原图的一个方块。单元格需要做的两件事：

每个边界框包含两个目标预测，每个目标包括5个预测值：x，y，w，h和置信度
每个单元格预测两个(默认)bbox位置，两个bbox置信度(confidence) ： 7 x 7 x 2=98个bbox。30=(4+1+4+1+20), 4个坐标信息，1个置信度(confidence)代表一个bbox的结果， 20代表 20类的预测概率结果

在这里插入图片描述

网格输出筛选

一个网格会预测两个Bbox，在训练时我们只有一个Bbox专门负责（一个Object 一个Bbox）
20 个类别概率代表这个网络中的一个bbox
confidence
- 如果grid cell里面没有object，confidence就是0
- 如果有，则confidence score等于预测的box和ground truth的IOU乘积,(每个cell 中两个bbox 都与真实值比较，确定最终的bbox)

非最大抑制(NMS)

训练损失

三部分损失 bbox损失+confidence损失+classfication损失

YOLO V2

针对YOLO算法，改进：（训练机制，网络改变–Darknet-19，k-means聚类算法对训练集中的边界框做了聚类分析，直接位置预测）

YOLO V3

改进：（网络Darknet-53，逻辑回归替代softmax作为分类器）

参考：
https://zhuanlan.zhihu.com/p/94986199
YOLO 论文

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。