计算机视觉技术发展火热,是当前人工智能技术核心领域之一,计算机视觉是人工智能领域的一颗明珠,它是目前人工智能领域最早得到应用的技术之一,拥有广大的发展空间,目前很多技术产品已经得到应用,并改变着这个世界。
目前计算机视觉的方向目前分为以下几种:目标分类、目标检测、目标识别、目标跟踪、目标分割、关键点检测。
目标分类
目标分类是最简单的图片分类问题,比如一张图片是猫还是狗,这就是基本的图片分类问题
目标检测
目标检测根据实际问题不同,方向很多,比如人脸检测、人性检测、车辆检测等等
如图所示,输入一张图片,不仅可以定位出狗,还可以定位到两辆车在图片中的位置,可以将其在图片中给框起来。目前常用的算法如下所示
R-CNN系列一般速度比较慢,但是精度比较搞,YOLO系列一般速度比较快,但是精度差一点,SSD是介于二者之间的
目标识别
一般目标检测和目标识别是一致的,因为图片中可能并不完全包含人脸,所以需要先进行目标检测,检测出图片中的对象,然后进行目标识别。我们以人脸识别为例,首先需要进行人脸目标检测,然后进行人脸定位和人脸关键点定位,人脸关键点定位可以进行人脸摆正,这样就可以使得神经网络不需要学习没有摆正的人脸了。
目前为止,常用的人脸检测的算法为DeepFace(脸谱网)、FaceNet(谷歌)、DeepID(商汤科技),本专栏之后会从FaceNet的角度介绍人脸识别,此网络使用的损失是三元组损失,除了这个损失之外,在人脸识别领域还存在其它的目标损失:
目标损失
目标跟踪
视觉目标跟踪是计算机视觉中的一个重要研究方向,有着广泛的应用,如:视频监控,人机交互, 无人驾驶等。在视频中,你想要跟踪一个目标,目标不是静止的,它是运动的。
目标跟踪
目标分割
目标分割就是将图片中把目标对应的部分分割出来,对于一般的光学图像而言,分割像素是一个比较常见的目标,就是要提取哪一些像素是我们所需要的目标,目前效果很好的模型是Mask R-CNN
关键点检测
基于一个图片可以将图片中目标的关键点找出来,这种技术在深度学习时代变得简单了
总结
计算机视觉应用广泛,通过本文我们应该知道计算机视觉并不只是一个简单的小领域,而且根据实际问题的不同,计算机视觉的又会分为很多的领域,如果想要学习人工智能中的计算机视觉,建议先学好卷积网络,然后再针对某一领域进行针对性学习。