目标检测与分类的区别（图片向）

最新推荐文章于 2025-02-01 14:36:17 发布

Annnnnm

最新推荐文章于 2025-02-01 14:36:17 发布

阅读量1w

点赞数 14

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42102716/article/details/102413235

版权

本文探讨了图像分类网络在目标检测中的应用，详细介绍了如何将预训练的分类网络如VGGNet、ResNet等，作为深度学习目标检测架构的基础，如FasterR-CNN、SSD或YOLO。通过网络手术，即修改网络为全卷积形式，剪除并替换某些层，使其适用于目标检测任务。此方法虽能创建复杂的端到端检测器，但需理解深度学习检测器的工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题：

图像分类网络是否可以用于目标检测
在什么情况下可以使用

图像分类与目标检测的区别

在这里插入图片描述

目标检测架构的基本网络

将一个预训练的分类网络作为深度学习目标检测架构（例如 Faster R-CNN、SSD 或者 YOLO）的基本网络。

这个方法的好处是：你可以创建一个基于深度学习的复杂端到端目标检测器。

而其不足之处是：它需要一些关于深度学习目标检测器如何工作的知识，我们将在后面的部分中讨论这个问题。

深度学习目标检测器的模块

在这里插入图片描述
图 4： VGG16 基本网络是 SSD 深度学习目标检测框架的一个特征抽取模块。

首先我们要知道，深度学习目标检测器有很多模块，子模块以及更小的子模块，但是我们今天要重点关注的是深度学习入门读者所困惑的两个：

目标检测框架（不包括 Faster R-CNN, SSD, YOLO）
适合目标检测框架的基本网络

基本网络就是你常用的分类 CNN 架构，包括：

VGGNet
ResNet
MobileNet
DenseNet

通常这些网络在大数据集上进行预训练来进行分类，例如 ImageNet，它们可以学习到很多具有鉴别能力的滤波器。

目标检测框架由很多组成部分和子模块构成：

Faster R-CNN 框架包括：

候选区域网络（RPN）
一组锚点
ROI 池化模块
最终基于区域的卷积神经网络

SSD（单步检测器，single shot detectors）包括：

多框（MultiBox）
先验（Priors）
固定先验（Fixed priors）

图 4 描述了 SSD 框架内部的 VGG-16 网络。通常，我们需要在基本网络上进行网络手术。这种修改包括：

变成全卷积的形式，并接受任意输入维度。
剪除了基本网络中更深层的卷积和池化层，将它们以一系列新层
（SSD）、新模块（Faster R-CNN），或者这两者的一些组合代替。
这里的「网络手术」是一种口语化的说法，它的意思是移除基本网络中的一些原始卷积层，将它们用新层替代。网络手术也是讲究策略的，我们移除一些不需要的部分，然后用一组新的部分来替代它们。

然后，当我们开始训练我们的框架进行目标检测时，（1）新层、模块和（2）基本网络的权重都被修改了。

在这里插入图片描述图片来自知乎-田昊

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。