什么是图像识别？

最新推荐文章于 2024-01-25 01:53:02 发布

Yi_Kong

最新推荐文章于 2024-01-25 01:53:02 发布

阅读量1w

点赞数 4

分类专栏：人工智能

本文链接：https://blog.csdn.net/weixin_42768004/article/details/105057210

版权

人工智能专栏收录该内容

10 篇文章 5 订阅

订阅专栏

本文将会介绍图像识别中涉及的一些概念和专业名词

图像识别的三大任务

●目标识别：对图片进行分类，确定图片中的目标是什么。

如下图要分类图中的水杯和水瓶，方体。

●目标检测：定位目标，确定目标在图片中的具体位置
在这里插入图片描述

●目标分割：对图片进行像素级的分类前景和背景，剔除背景并描述目标的形状

不剔除背景：
在这里插入图片描述
剔除背景：

这里着重介绍目标检测

目标检测的定义

●识别图中有哪些物体以及定位物体的位置，这里的位置的表现形式是坐标。
在这里插入图片描述
位置的表现形式：坐标
●极坐标：（Xmin,Xmax,Ymin,Ymax）
检测框BBox（bounding box）四个角对应的坐标
以图片的左上角为原点建立坐标

●中心坐标：（X,Y,W,H）
同样以图片左上角为原点建立坐标。
这里X,Y表达的是中心点的坐标，即检测框的中心处
W,H则是检测框的宽和高。
在这里插入图片描述
目标检测细分：
●目标检测：图片中有多个目标
●分类+定位：图片中只有一个目标

目标检测的发展与分类

1、传统目标检测方法：手工提取特征，候选区，分类器
2、CNN提取分类的目标检测框架：R-CNN,Fast-CNN,Faster-CNN
3、端到端的目标检测框架：YOLO,SSD

其中除了传统的检测方式，CNN与端到端刚好分为两类。
●两步走：先进行区域推荐，再进行目标检测的判断。
●端到端：一个网络一步到位
在这里插入图片描述
两步走是随机在图片中推荐区域，然后进入网络判断是否为要检测的目标。
端到端则直接定位图片中的目标，可以说后者的效率会更高一点。

目标检测的准确率评估

在用CNN做图像分类中会有softmax函数进行结果计算。而在目标检测中IoU(交并比）来计算结果。
●IoU:两个区域的重叠程度
前面提到的检测框bounding box.分为两类：一类是真实目标框，也就是用于训练模型的图片中手动标注的目标框（Ground-truth bounding box）。另一类则是模型预测时的目标框（Predicted bounding box）
在这里插入图片描述
IoU的计算公式为：真实目标框与预测目标框相交的面积/两个目标框总的面积。

所以当结果为1时，真实目标框与预测目标框重合。也就是说目标检测的位置准确率为100%。

END

图片源于黑马程序员

Yi_Kong

关注

4
点赞
踩
82

收藏

觉得还不错? 一键收藏
0
评论
什么是图像识别？

本文将会介绍图像识别中涉及的一些概念和专业名词图像识别的三大任务●目标识别：对图片进行分类，确定图片中的目标是什么。如下图要分类图中的水杯和水瓶，方体。●目标检测：定位目标，确定目标在图片中的具体位置●目标分割：对图片进行像素级的分类前景和背景，剔除背景并描述目标的形状不剔除背景：剔除背景：这里着重介绍目标检测目标检测的定义●识别图中有哪些物体以及物体的位置，这里的位置...
复制链接

扫一扫