论文阅读准备知识

最新推荐文章于 2024-07-05 18:00:22 发布

雯雯Didi

最新推荐文章于 2024-07-05 18:00:22 发布

阅读量113

点赞数 1

分类专栏：目标检测文章标签：目标检测计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44876084/article/details/120950020

版权

目标检测专栏收录该内容

1 篇文章 0 订阅

订阅专栏

论文阅读准备知识

一、YOLO

一、YOLO

1.YOLO网络结构

GoogLeNet + 4个卷积 + 2个全连接层
网格输出大小： 7 x 7 x 30 Tip：Image size = 7 x 7

2.流程理解

单元格：
7 x 7 = 49个像素值，理解为49个单元格

每个单元格负责预测一个物体类别，并且直接预测物体的概率值
每个单元格：两个（默认）bbox位置，两个置信度(confidene)

一个bbox : xmin , ymin , xmax , ymax , confidence
两个bbox : 4 + 1 + 4 + 1 = 10个值
30 ：已用了10个，剩余20表示20类的预测结果

3.网格输出筛选

一个网格会预测两个bbox，在训练时我们只有一个bbox专门负责预测概率。
20个类别概率代表这个网格当中的一个bbox。

每个bounding box都对应一个confidence score.

如果grid cell里没有object，confidence就是0
如果有，则confidence score等于预测的bbox 和 ground truth 的IOU乘积
两个bbox的4个值斗鱼ground truth进行IOU计算，得到两个IOU值，比大小

如何判断一个grid cell里是否包含object呢？
如果一个 object 的 ground truth 的中心点坐标在一个 grid cell 中，那么这个grid cell 就是包含这个object，也就是说这个object的预测由该 grid cell 负责

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文阅读准备知识

论文阅读准备知识一、YOLO1.YOLO网络结构2.流程理解3.网格输出筛选一、YOLO1.YOLO网络结构GoogLeNet + 4个卷积 + 2个全连接层网格输出大小： 7 x 7 x 30 Tip：Image size = 7 x 72.流程理解单元格：7 x 7 = 49个像素值，理解为49个单元格每个单元格负责预测一个物体类别，并且直接预测物体的概率值每个单元格：两个（默认）bbox位置，两个置信度(confidene)一个bbox : xmin , ymi
复制链接

扫一扫

专栏目录

雯雯Didi CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

65万+: 周排名

202万+: 总排名

2418: 访问

: 等级

204: 积分

1: 粉丝

5: 获赞

1: 评论

2: 收藏

私信

关注

热门文章

分类专栏

最新评论

形态学图像处理
不正经的kimol君: 爱了爱了，写得确实不错哦，一起加油

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。