04.卷积神经网络 —— week3.目标检测（编程作业）

最新推荐文章于 2021-10-03 21:38:46 发布

涛涛酱

最新推荐文章于 2021-10-03 21:38:46 发布

阅读量160

点赞数

分类专栏：深度学习课程——吴恩达深度学习吴恩达——深度学习课程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/iCode_girl/article/details/88535600

版权

深度学习同时被 3 个专栏收录

26 篇文章 1 订阅

订阅专栏

深度学习课程——吴恩达

24 篇文章 0 订阅

订阅专栏

吴恩达——深度学习课程

23 篇文章 1 订阅

订阅专栏

Task：

学习使用YOLO算法进行对象识别。

输入图像为(608,608,3)
输入的图像先要通过一个CNN模型，返回一个(19,19,5,85)的数据。
在对最后两维降维之后，输出的维度变为了(19,19,425):
- 每个19x19的单元格拥有425个数字。
- 425 = 5 x 85，即每个单元格拥有5个锚框，每个锚框由5个基本信息+80个分类预测构成。
- 85 = 5 + 80，其中5个基本信息是 $(p c, p x, p y, p h, p w)$ ,剩下80就是80个分类的预测。
然后我们会根据以下规则选择锚框：
- 预测分数阈值：丢弃分数低于阈值的分类的锚框。
- 非最大值抑制：计算交并比，并避免选择重叠框。
最后给出YOLO的最终输出。

还是只对YOLO算法流程有了一个大概的了解，代码还是不太。。。emm。

吴恩达深度学习深度学习课程连载笔记中文版：https://blog.csdn.net/u013733326/article/details/80341740

好的，04的最后一周出发。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
04.卷积神经网络 —— week3.目标检测（编程作业）

Task：学习使用YOLO算法进行对象识别。输入图像为(608,608,3)输入的图像先要通过一个CNN模型，返回一个(19,19,5,85)的数据。在对最后两维降维之后，输出的维度变为了(19,19,425):每个19x19的单元格拥有425个数字。425 = 5 x 85，即每个单元格拥有5个锚框，每个锚框由5个基本信息+80个分类预测构成。85 = 5 + 80，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。