[目标检测]——基础介绍

最新推荐文章于 2024-04-27 22:01:23 发布

Star星屹程序设计

最新推荐文章于 2024-04-27 22:01:23 发布

阅读量693

点赞数

分类专栏：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42067873/article/details/117392120

版权

计算机视觉专栏收录该内容

24 篇文章 2 订阅

订阅专栏

目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具有挑战性的问题。

一、目标检测算法分类

1、两步走的目标检测

先找出候选的一些区域，而后对区域进行调整、分类

代表算法：R-CNN、SPP-net、Fast R-CNN、Faster R-CNN

2、端到端的目标检测

采用一个网络，直接输入到输出，一步到位

一般输入是图片，输出有哪些物体、物体在什么位置等信息

二、目标检测的任务

1、首先是分类任务

N 个类别
输入：图片
输出：类别标签
评估指标：Accuracy

2、其次是定位问题

N个类别
输入：图片
输出：物体的位置坐标
主要评估指标： IOU

（1）bounding box（bbox）物体的框

物体位置：

（x, y, w, h）：x，y物体的中心点位置，以及中心点距离物体两边的长、宽（h,w）
（xmin, ymin, xmax, ymax）：物体位置的左上角、右下角的坐标

两种Bounding box名称：

Ground-truth bounding box：图片当中真实标记的框
Predicted bounding box：预测的时候标记的框

（2）图像的坐标

三、目标定位的简单实现思路

在分类的时候直接输出各个类别的概率，如果加上定位的话，可以考虑在网络的最后输出加上位置信息。

做法：增加一个全连接层输出4个位置信息，做损失计算

假设有10个类别，输出[p1, p2, ....., p10]，然后输出这一个对象的四个位置信息[x，y，w，h]。同理可以知道网络输出什么，要衡量这个网络的损失：

对于分类的概率，使用交叉商损失
位置信息具体的数值，可使用MSE均方误差损失（L2损失）

Star星屹程序设计

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
1
评论
[目标检测]——基础介绍

一、目标检测算法分类1、两步走的目标检测先进行区域推荐，而后进行目标检测d
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Star星屹程序设计 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。