目标检测学习笔记

最新推荐文章于 2023-04-06 16:57:59 发布

星辰大海_2020

最新推荐文章于 2023-04-06 16:57:59 发布

阅读量309

点赞数

文章标签：计算机视觉 pytorch 深度学习人工智能

本文链接：https://blog.csdn.net/weixin_41870056/article/details/111241861

版权

本次学习中的相关代码基于Pytorch库实现。

1 目标检测基本概念

目标检测是计算机视觉领域中应用非常广泛的一个重要方向，根据个人兴趣开始相关知识学习，并撰写学习笔记，主要为巩固学习效果、督促自我进步，有不正确的地方请读者不吝指教。

目标检测与图像分类的区别：

内容：目标检测首先需要识别出图片中target类别，在此基础上，需要精确定位目标的具体位置，并用矩形框标出；图像分类只需要判断输入图像中是否包含特定的target。
返回：目标检测的标签信息包括目标类别、目标位置、目标外框；图像分类的标签信息指目标类别。

目标检测返回的目标位置用矩形边界框的坐标表示，一般有两种表示方式（可相互转化）：

$x_{min}, y_{min}, x_{max}, y_{max})$ ： $x_{min},y_{min})$ 为矩形框的左上角坐标， $x_{max},y_{max})$ 为矩形框的右下角坐标。
$c_x,c_y,w,h)$ ： $c_x,c_y)$ 为矩形框的中心坐标， $(w, h)$ 为矩形框的宽和高。
可通过如下公式进行相互转化：
$\left\{ \begin{aligned} c_x = \frac{x_{max}+x_{min}}2\\ c_y = \frac{y_{max}+y_{min}}2\\ w=x_{max}-x_{min}\\ h=y_{max}-y_{min} \end{aligned} \right.$

关注