一、目标检测与识别
目标检测与识别是很多计算机视觉任务的基础,通俗地讲,其目的是在目标场景中将目标用一个个框框出来,并且识别出这个框中的物体。即包括加测(where)和识别(what)两个过程。
1.技术难点
目标检测与识别任务对于人类来说,是一项非常简单的任务,但对于计算机却相当的困难,究其原因,是由很多不定因素所造成的,我将其总结为“八不定因素”,如下表:
物体的尺寸不定 | 物体的位置不定 |
物体的姿态不定 | 物体的数量不定 |
物体的光照环境不定 | 物体的遮盖程度不定 |
物体的颜色不定 | 物体的背景不定 |
2.算法分类
经过数十年的发展,在各国学者的共同努力下,目标检测与识别技术得到飞速发展,各类优秀算法不断涌现,算法性能不能提高,截止目前,主要有两大类:基于传统图像处理和机器学习算法的目标检测与识别算法和基于深度学习的目标检测与识别方法。
① 基于传统图像处理和机器学习算法的目标检测与识别算法
流程:目标特征提取、目标识别、目标定位
这里的特征都是人为设计的,例如SIFT(Scale Invariant Feature Transform 尺度不变特征变换算法),HOG(Histogram of Oriented Gradient 方向梯度直方图特征),SURF(Speeded Up Robust Features 加速稳健特征)等,通过这些特征对目标进行识别,然后结合相应的策略对目标进行定位。
② 基于深度学习的目标检测与识别算法
目前,基于深度学习的目标检测和识别算法已经成为主流,大致流程为:图像的深度特征提取->基于神经网络的目标定位于识别,其中用到的深度神经网络模型是CNN,根据细节的不同可以再次细分,分类以及代表算法如下表:
类别 | 代表算法 |
---|---|
基于区域建议的目标检测与识别算法 | R-CNN/Fast-R-CNN/Faster-R-CNN |
基于回归的目标检测与识别算法 | YOLO/SSD |
基于搜索的目标检测与识别算法 | 基于视觉注意的AttentionNet/基于强化学习的算法 |
3.应用领域
目标检测与识别作为计算机领域的基石,在生活中很多领域有着广泛的应用,也越来越受到重视,下图从应用领域、具体项目、代表公司三个方面进行了总结:
应用领域 | 具体项目 | 代表公司 |
安全领域 | 指纹识别、人脸识别 | Face++、依图科技、深醒科技 |
军事领域 | 地形勘察、飞行物识别 | 全悉科技 |
交通领域 | 车牌号识别、无人驾驶、交通标志识别 | 纵目科技、图森科技、驭势科技 |
医疗领域 | 心电图、B超、健康管理、营养学 | 智影医疗、图玛深维 |
生活领域 | 智能家居、购物、智能测肤 | Yi+、木薯科技、肌秘 |
4.顶级期刊
随着目标检测与识别技术的发展,越来越多的相关研究成果发表在各种顶级期刊或者会议上,这些期刊是我们学习资源的主要来源,可以让我们及时跟踪技术的发展:
期刊 | 全称 | URL |
Elsevier | ScienceDirect OnSite, SDOL | http://www.sciencedirect.com/ |
ICCV | IEEE International Conference on Computer Vision | http://ieeexplore.ieee.org/xpl/conhome.jsp?punumber=1000149 |
CVPR | IEEE Conference on Computer Vision and Pattern Recognition | http://ieeexplore.ieee.org/xpl/conhome.jsp?punumber=1001809 |
PAMI | IEEE Transactions on Pattern Analysis and Machine Intelligence | http://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=34 |
IJCV | IJCV | http://link.springer.com/journal/11263 |
ECCV | ECCV | http://link.springer.com/search?query=ECCV |
TIP | TIP | http://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=83 |
CVPapers | CVPapers | http://www.cvpapers.com/index.html |
二、专栏内容
接下来让我们将一起进入《目标检测与识别》专栏,这一专栏,主要介绍基于深度学习的目标检测和识别算法,一星期更新一篇,每一篇对应一个算法,从R-CNN到SSD,由易到难,不断推进,如果您也对此感兴趣,可以关注我们的公众号《知你驿站》,您的关注就是我们的动力,期待您的加入。
三、参考文章
HOU_JUN | http://www.cnblogs.com/houjun/p/8424893.html
笨拙的石头 | https://blog.csdn.net/qq_32241189/article/details/80573087
yyhssg | https://www.cnblogs.com/yhyue/p/9247962.html
迷茫不可怕,可怕的是迷茫之后还是迷茫 ---quinta