深度学习－单发探测器(2)

最新推荐文章于 2023-05-14 12:01:36 发布

weixin_38498942

最新推荐文章于 2023-05-14 12:01:36 发布

阅读量602

点赞数

分类专栏： sdk

本文链接：https://blog.csdn.net/weixin_38498942/article/details/108376931

版权

sdk 专栏收录该内容

281 篇文章 30 订阅

订阅专栏

Yolo:

该检测器的精度稍差一些（在v2上进行了改进），但它是一种非常快速的检测器，本章将尝试解释其工作原理，并在tensorflow中提供参考工作代码。此检测器的想法是，您可以在CNN模型上运行图像，并在一次通过中获得检测。首先将图像调整为448x448，然后馈入网络，最后通过非最大抑制算法对输出进行过滤。
在这里插入图片描述

训练阶段步骤：
1、查看哪个单元格靠近地面真相边界框的中心。（匹配阶段）
2、从特定单元格检查哪个边界框与地面实况（IoU）重叠更多，然后减小重叠较少的边界框的置信度。（每个边界框都具有置信度）
3、从没有对象的每个像元中降低所有边界框的置信度。也不要调整这些单元格的框坐标或类概率。
4、减少不包含任何对象的单元格的边界框置信度。
Yolo检测器最近得到了改进，列出了它们的主要改进：
1、更快
2、更准确（在Pascal数据集上为73.4 mAP（所有类别的平均平均精度）
3、最多可以检测9000个课程（之前为20个）
他们做了哪些改进：
1、添加了Batchnorm
2、在Imagenet上以多个比例（224x224）然后（448x448）进行预训练，然后再对它们进行训练以进行检测。
3、现在他们使用Faster-RCNN之类的锚框，分类是按照每个框的形状而不是每个网格单元进行的
4、他们使用K均值来获取基于数据的盒子形状，而不是手动选择盒子形状
5、可以从多个角度训练网络，因为网络现在是完全卷积的（NO FC层），这很容易做到。
6、他们在Image-net和MS-COCO上进行训练
7、他们创建了一种新的机制来训练没有检测数据的数据集。通过选择多部分损失函数，传播什么。
8、使用WordTree将来自各种来源的数据与我们的联合优化技术相结合，以同时在ImageNet和COCO上进行训练。

SSD：
在这里插入图片描述

SSD探测器与其他单发探测器不同，这是因为使用了多层，可以在不同比例的物体上提供更高的精度。（每个更深的层将看到更大的对象）。
SSD通常从Resnet上的VGG预训练模型开始，然后将其转换为完全卷积神经网络。然后，我们附加一些额外的转换层，这实际上将有助于处理更大的对象。 SSD架构原则上可以与任何深度网络基础模型一起使用。
需要注意的重要一点是，在图像通过VGG网络传递后，添加了一些转换层，从而生成尺寸为19x19、10x10、5x5、3x3、1x1的特征图。这些以及由VGG的conv4_3生成的38x38特征图，将用于预测边界框。
在这里插入图片描述

如图所示，某些激活已从网络“抓取”并传递到专用的子网，该子网应用作分类器和本地化器。在预测期间，我们使用非最大值抑制算法来过滤每个可能出现的对象的多个框。
在这里插入图片描述

总结：

本章节我们主要介绍了单发探测器相关内容，包括与Yolo、SSD。后面将继续介绍深度学习相关内容。

weixin_38498942

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习－单发探测器(2)

Yolo:该检测器的精度稍差一些（在v2上进行了改进），但它是一种非常快速的检测器，本章将尝试解释其工作原理，并在tensorflow中提供参考工作代码。此检测器的想法是，您可以在CNN模型上运行图像，并在一次通过中获得检测。首先将图像调整为448x448，然后馈入网络，最后通过非最大抑制算法对输出进行过滤。训练阶段步骤：1、查看哪个单元格靠近地面真相边界框的中心。（匹配阶段）2、从特定单元格检查哪个边界框与地面实况（IoU）重叠更多，然后减小重叠较少的边界框的置信度。（每个边界框都具有置信
复制链接

扫一扫