吴恩达深度学习4-Week3课后作业-自主驾驶-汽车检测

最新推荐文章于 2020-11-22 10:01:38 发布

HUANG Zichen

最新推荐文章于 2020-11-22 10:01:38 发布

阅读量1.1k

点赞数

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Apple_hzc/article/details/84402384

版权

这篇博客详细介绍了如何使用YOLO算法进行汽车检测，适用于自动驾驶系统。内容包括YOLO算法的工作原理、模型输入输出的详细解释，以及非极大值抑制在减少重叠边界框中的作用。此外，还分享了相关算法的代码实现和运行结果，以及YOLO在物体检测领域的优势和实际应用。

摘要由CSDN通过智能技术生成

一、Deeplearning-assignment

在本周的作业中，将通过使用大的YOLO模型来了解对象检测。

您将学习:

在一个汽车检测数据集上使用对象检测
处理边界框

问题陈述：你正在开一辆自驾车。作为这个项目的重要组成部分，您首先要建立一个汽车检测系统。为了收集数据，你已经把摄像头安装在汽车的引擎盖上（意思是前面），在驾驶时每隔几秒就会拍摄前方的道路。

您已经将所有这些图像收集到一个文件夹中，并在您能找到的每辆车周围绘制了边界框来标记它们。这是一个你的边界框的例子。

如果你需要YOLO识别的类别有80个, 您可以用一个1到80的整数来表示类别标签c，或者用一个80维的向量 (有80个数字)，其中一个是1，其余的是0。在视频讲座中使用的是后者。

YOLO算法

YOLO ("you only look once") 是一个非常流行的算法，因为它的精确率非常高，同时也能实时运行。这个算法对图像只需处理一次，它只需要一个前向传播就能进行预测。经过非极大值抑制后，它将边界框与识别的对象一起输出。

非极大值抑制指只需要输出概率最大的分类结果，抑制那些很接近但不是最大的其他预测结果。

有关模型的一些细节：

The input is a batch of images of shape (m, 608, 608, 3)
The output is a list of bounding boxes along with the recognized classes. 每个边界框用6个数字表示 (pc,bx,by,bh,bw,c)(pc,bx,by,bh,bw,c). If you expand cc into an 80-dimensional vector, each bounding box is then represented by 85 numbers.

我们会使用 5 个 anchor boxes. So you can think of the YOLO architecture as the following: IMAGE (m, 608, 608, 3) -> DEEP CNN -> ENCODING (m, 19, 19, 5, 85).

现在让我们仔细看看这个 ENCODING 代表什么。

如果一个对象的中心/中点落入一个网格单元中，那么该网格单元负责检测该对象。

由于我们使用了5个 anchor boxes，所以19x19单元中的每一个都编码了5个框的信息。为了简单起见，我们将shape(19, 19, 5, 85)的最后两个维度展平，所以 Deep CNN 的输出是 (19, 19, 425)。

现在，对于每个单元格中的每个box，我们进行下面的计算，提取每个box包含某个类别的概率。

下面是一种可视化YOLO图像预测内容的方法：

For each of the 19x19 grid cells, find the maximum of the probability scores (taking a max across both the 5 anchor boxes and across different classes).
Color that grid cell according to what object that grid cell considers the most likely.

按以上方法做了后可以产生下面的结果：

另一种可视化YOLO输出的方法是绘制它

最低0.47元/天解锁文章

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。