深度学习-ResNet-50实现目标检测(基于Pascal VOC数据集)2

由于平台审核问题,请移步,后期将脱离此平台

深度学习-ResNet-50实现目标检测(基于Pascal VOC数据集)2 - 知乎摘要:关于上一篇文章《深度学习-ResNet-50实现目标检测(基于Pascal VOC数据集)》很多朋友提到说,作者你实现的属于分类任务,不属于目标检测。如果按照课本和其他教程上来说确实如此,但是呢,我还是理解为目标…https://zhuanlan.zhihu.com/p/637587661

        摘要:关于上一篇文章《深度学习-ResNet-50实现目标检测(基于Pascal VOC数据集)》很多朋友提到说,作者你实现的属于分类任务,不属于目标检测。如果按照课本和其他教程上来说确实如此,但是呢,我还是理解为目标检测,从网络现实结合到现实问题,我个人保留自己的主观意见。这里建议大家按照课本的定义进行归纳。

        大家好,上一期我介绍了使用ResNet实现了目标检测,检测图片中是否有指定的对象。但是一直缺少了标注的位置信息,所以看起来总是缺少了一部分内容。那么,今天我来完善一下,把边框信息也给识别出来吧。

        在不使用第三方目标检测框架的情况下,如何才能实现这个功能呢?使用如yolo这样的目标检测框架来实现功能,确实非常的简单,但是它是一个黑箱,我们没法知道它背后的原理,没有原理的代码是没有灵魂的。那我们来思考下,应该怎么来实现这个功能?

        简单的说,目标检测任务旨在从图像中标记出感兴趣的对象的位置和形状。为了完成这个任务,我们需要将每个对象的位置和形状用一组数值来描述。这组数值通常称为边界框 (bounding box) 或 bounding box 的位置坐标和大小。在目标检测中,我们可以使用回归模型来学习将图像特征映射到每个对象的边界框位置和大小的映射关系。换句话说,回归模型可以学习如何从图像特征预测边界框位置和大小。使用回归可以识别出来主要是因为回归模型可以有效地学习目标物体的位置和大小以及与之相关的特征,这样就可以更加准确地预测边界框坐标和大小。此外,回归模型还可以使用深度神经网络等强大的算法来提取图像特征,从而从复杂的图像中检测出不同的目标物体。综合来看,使用回归模型可以使目标检测具有更高的准确性和鲁棒性。

        思路这不就来了吗?对了,我们使用回归的方式来预测边界框,本着不浪费的精神,作者就把上一篇的模型拿过来修改修改吧,毕竟这个并不困难。

        在这一类的目标检测中,我们需要检测出目标是什么名称以及他的位置和边框,使用分类的方式可以将目标检测出来,使用回归的方式,我们把位置和边框检测出来这个网络就完整了,但是,分类和位置以及边框他们同时存在的(这里我们约定,他们两个同样重要,也就是说,检测出目标:检测出目标位置和边框=1:1),可以在实际的应用场景中设置不同的比例。

        ok,把这块模型代码放出来吧,做个接水管的事情而已

.........................

.........................

.........................

........................

........................

如有疑问请添加群:195889612

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值