深度学习-ResNet-50实现目标检测（基于Pascal VOC数据集）2

四维空间151

已于 2023-06-16 16:40:11 修改

阅读量494

点赞数 2

文章标签：深度学习目标检测计算机视觉

于 2023-06-13 00:14:15 首次发布

本文链接：https://blog.csdn.net/xingxingzhilong/article/details/131179162

版权

由于平台审核问题，请移步，后期将脱离此平台

深度学习-ResNet-50实现目标检测（基于Pascal VOC数据集）2 - 知乎摘要：关于上一篇文章《深度学习-ResNet-50实现目标检测（基于Pascal VOC数据集）》很多朋友提到说，作者你实现的属于分类任务，不属于目标检测。如果按照课本和其他教程上来说确实如此，但是呢，我还是理解为目标…https://zhuanlan.zhihu.com/p/637587661

摘要：关于上一篇文章《深度学习-ResNet-50实现目标检测（基于Pascal VOC数据集）》很多朋友提到说，作者你实现的属于分类任务，不属于目标检测。如果按照课本和其他教程上来说确实如此，但是呢，我还是理解为目标检测，从网络现实结合到现实问题，我个人保留自己的主观意见。这里建议大家按照课本的定义进行归纳。

大家好，上一期我介绍了使用ResNet实现了目标检测，检测图片中是否有指定的对象。但是一直缺少了标注的位置信息，所以看起来总是缺少了一部分内容。那么，今天我来完善一下，把边框信息也给识别出来吧。

在不使用第三方目标检测框架的情况下，如何才能实现这个功能呢？使用如yolo这样的目标检测框架来实现功能，确实非常的简单，但是它是一个黑箱，我们没法知道它背后的原理，没有原理的代码是没有灵魂的。那我们来思考下，应该怎么来实现这个功能？

简单的说，目标检测任务旨在从图像中标记出感兴趣的对象的位置和形状。为了完成这个任务，我们需要将每个对象的位置和形状用一组数值来描述。这组数值通常称为边界框 (bounding box) 或 bounding box 的位置坐标和大小。在目标检测中，我们可以使用回归模型来学习将图像特征映射到每个对象的边界框位置和大小的映射关系。换句话说，回归模型可以学习如何从图像特征预测边界框位置和大小。使用回归可以识别出来主要是因为回归模型可以有效地学习目标物体的位置和大小以及与之相关的特征，这样就可以更加准确地预测边界框坐标和大小。此外，回归模型还可以使用深度神经网络等强大的算法来提取图像特征，从而从复杂的图像中检测出不同的目标物体。综合来看，使用回归模型可以使目标检测具有更高的准确性和鲁棒性。

思路这不就来了吗？对了，我们使用回归的方式来预测边界框，本着不浪费的精神，作者就把上一篇的模型拿过来修改修改吧，毕竟这个并不困难。

在这一类的目标检测中，我们需要检测出目标是什么名称以及他的位置和边框，使用分类的方式可以将目标检测出来，使用回归的方式，我们把位置和边框检测出来这个网络就完整了，但是，分类和位置以及边框他们同时存在的（这里我们约定，他们两个同样重要，也就是说，检测出目标：检测出目标位置和边框=1：1），可以在实际的应用场景中设置不同的比例。

ok，把这块模型代码放出来吧，做个接水管的事情而已

.........................

........................

如有疑问请添加群：195889612

四维空间151

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习-ResNet-50实现目标检测（基于Pascal VOC数据集）2

对了，做上一步位置转换之前，还有一个注意点，由于网络输入的size是224，而且我们用的是batch的方式训练的，所以图片会resize到224，那么问题来了，label位置就会发生改变，所以需要处理下label的位置，这里是一个注意点。在这一类的目标检测中，我们需要检测出目标是什么名称以及他的位置和边框，使用分类的方式可以将目标检测出来，使用回归的方式，我们把位置和边框检测出来这个网络就完整了，但是，本着不浪费的前提，把上一篇的代码拿过来用一下吧，不同的是，这里的标签是需要我们处理一下的。
复制链接

扫一扫