图像识别中，目标分割、目标识别、目标检测和目标跟踪这几个方面区别是什么？+资料列表

最新推荐文章于 2024-06-10 12:10:07 发布

haima1998

最新推荐文章于 2024-06-10 12:10:07 发布

阅读量2.3w

点赞数 4

分类专栏： deep learning

deep learning 专栏收录该内容

243 篇文章 16 订阅

订阅专栏

【目标识别】深度学习进行目标识别的资源列表(转)

https://zhuanlan.zhihu.com/p/26076489

以下转自：https://www.zhihu.com/question/36500536

作者：知乎用户
链接：https://www.zhihu.com/question/36500536/answer/67939194
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

泻药，我基本同意楼上的答案，但想仔细地定义一下。就像我一贯认为的，对问题进行清楚的定义，往往是最重要的一步。

（1）目标分割，应该是Target Segmentation，应该是data/image segmentation的一种。这里假定数据是图像，就如楼上说的，任务是把目标对应的部分分割出来。对于一般的光学图像而言，分割像素是一个比较常见的目标，就是要提取哪一些像素是用于表述已知目标的。这种Segmentation可以是一个分类（classificatio）问题，就是把每一个pixel做labeling，提出感兴趣的那一类label的像素。也可以是clustering的问题，即是不知道label，但需要满足一些optimality，比如要cluster之间的correlation最小之类的。
当然，答主也见过一些针对其他数据的目标分割，比如hyperspectral data，也需要分割哪些频率或者通道对应的是目标。比如视频流，那段时间对应是目标。
下面是一个Target Segmentation的栗子：
&amp;lt;img src="https://i-blog.csdnimg.cn/blog_migrate/a83847ca2a2995635ded4ac0d4943427.png" data-rawwidth="602" data-rawheight="337" class="origin_image zh-lightbox-thumb" width="602" data-original="https://pic1.zhimg.com/5a767c0f13b253eedb23199b7454d0b4_r.png"&amp;gt;

（2）目标识别，应该是Target Recognition。这是一个基于分类（Classification）的识别（Recognition）问题，即是在所有的给定数据中，分类出哪一些sample是目标，哪一些不是。还是拿图片作为数据举例，这个分类的层面往往不是pixel，给定的一些segment，或者定义的对象（Object），或者图片本身。
下面是一个Target Recognition的栗子：
&amp;lt;img src="https://i-blog.csdnimg.cn/blog_migrate/5e92b57ea3cb2c313bdab5b145527f00.png" data-rawwidth="1024" data-rawheight="317" class="origin_image zh-lightbox-thumb" width="1024" data-original="https://pic4.zhimg.com/7b2f4dcc46920adfef0594343dfce0c3_r.png"&amp;gt;
（3）目标检测，应该是Target Detection。最早的detection system应该是搞雷达的人首先提出并且heavily study的，最简单的任务就是从看似随机（random）又充满干扰（interference）和噪音（noise）的信号中，抓取到有信息的特征（information-bearing pattern）。最简单的一个栗子，就是当你拿到一段随机的雷达回波，可以设置一个threshold，当高于这个threshold，就认为是探测到了高速大面积飞行器之类的高回波的目标。当然，这里面的threshold该怎么设计，涉及到False Alarm和Miss Detection之间的平衡。人们往往需要寻找最佳的transform或者domain去对信号进行分析。
下面是一个Target Detection的栗子：
&amp;lt;img src="https://i-blog.csdnimg.cn/blog_migrate/481382e81e5bc338e921c1345808fe6d.jpeg" data-rawwidth="1045" data-rawheight="1035" class="origin_image zh-lightbox-thumb" width="1045" data-original="https://pic4.zhimg.com/ba971eab1ba26ac432f78ccbfb37388b_r.jpg"&amp;gt;
（3）目标追踪，应该是Target Tracking。这个任务很重要的第一点是目标定位（Target Locating），而且这个任务设计到的数据一般具有时间序列（Temporal Data）。常见的情况是首先Target被Identify以后，算法或者系统需要在接下来时序的数据中，快速并高效地对给定目标进行再定位。任务需要区别类似目标，需要避免不要的重复计算，充分利用好时序相关性（Temporal Correlation），并且需要对一些简单的变化Robust，必须旋转，遮盖，缩小放大，Motion Blur之类的线性或者非线性变化。
下面是一个Target Detection的栗子：
&amp;lt;img src="https://i-blog.csdnimg.cn/blog_migrate/61799f67b185410e3e69c6baa6aec369.jpeg" data-rawwidth="480" data-rawheight="360" class="origin_image zh-lightbox-thumb" width="480" data-original="https://pic4.zhimg.com/cd89972dcddad9f7e7a9b760d71d7d57_r.jpg"&amp;gt;

发布于 2015-10-16

典型的技术路线是：目标分割 ——>目标检测 ——>目标识别 ——>目标跟踪
粗略的理解：
目标分割：像素级的对前景与背景进行分类，将背景剔除；
目标检测：定位目标，确定目标位置及大小；
目标识别：定性目标，确定目标是什么；
目标跟踪：追踪目标运动轨迹。

举个栗子，如：需要对视频中的小明进行跟踪，处理过程将经历如下过程：
（1）首先，采集第一帧视频图像，因为人脸部的肤色偏黄，因此可以通过颜色特征将人脸与背景分割出来（目标分割）；
（2）分割出来后的图像有可能不仅仅包含人脸，可能还有部分环境中颜色也偏黄的物体，此时可以通过一定的形状特征将图像中所有的人脸准确找出来，确定其位置及范围（目标检测）；
（3）接下来需将图像中的所有人脸与小明的人脸特征进行对比，找到匹配度最好的，从而确定哪个是小明（目标识别）；
（4）之后的每一帧就不需要像第一帧那样在全图中对小明进行检测，而是可以根据小明的运动轨迹建立运动模型，通过模型对下一帧小明的位置进行预测，从而提升跟踪的效率（目标跟踪）

发布于 2017-04-18

detection: find all objects (bounding box)

classification: classify objects

recognition: whether one is object

segmentation: cut all objects (pixel wise)

localization: find certain object (bounding box)

发布于 2017-04-03

个人感觉是这样子的：
在图像中有多少个像素属于物体
物体是什么
物体在哪里
物体怎么运动
回答不一定准确

发布于 2015-10-15

分割：可以图像分割范畴，将图像分成有意义的几块或者提取其中感兴趣区域，方法很多，也可以用到检测方法，比如人脸，行人检测。分割一般精度要求较高。
识别：预先获得感兴趣图片或者区域，利用机器学习方法进行分类，比如判断物体是苹果还是一本书。应用很多很多。
检测：检测有明确目的性，需要检测什么就去获取样本，然后训练得到模型，最后直接去图像上进行匹配，其实也是识别的过程。
跟踪：它不一定用到模式识别方法，最简单的运动目标时间空间匹配就能实现。当然也能用检测识别方法，这样做速度比较慢一般。
上面每个都有很多深入研究，一言两语就这样了

发布于 2015-10-16

目标检测：target detection，是一种二元分类方法，将影像分为目标和背景两类，主要依据一定的算法和先验信息来进行探测（先验通常包括目标先验，有的算法也会有背景先验），最后的结果是输出探测统计值，进行阈值分割，通常可以用ROC曲线、曲线下面积、探测值为1时的虚警率等来进行评价。所以是基于像元的，而不是输出目标（object），关注的是每个像元的判断：是目标或是背景。

haima1998

关注

4
点赞
踩
69

收藏

觉得还不错? 一键收藏
0
评论
图像识别中，目标分割、目标识别、目标检测和目标跟踪这几个方面区别是什么？+资料列表

转自：https://www.zhihu.com/question/36500536作者：知乎用户链接：https://www.zhihu.com/question/36500536/answer/67939194来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。泻药，我基本同意楼上的答案，但想仔细地定义一下。就像
复制链接

扫一扫