计算机视觉应用(Computer vision)是指用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解。
计算机视觉可以分为以下几大方向:
图像分类
目标检测
图像分割
图像重构
图像生成
风格迁移
超分辨率
人脸
图像分类/Image Classification/
图像分类,也可以称为图像识别,顾名思义,就是辨别图像是什么,或者说图像中的物体属于什么类别。
图像分类根据不同的分类标准可以划分许多子方向。
比如根据分类对象,可以划分为:
通用分类,比如简单划分为鸟类、车、猫、狗等类别;
细粒度分类,目前图像分类比较热门的领域,比如鸟类、花卉、猫狗等类别,它们的一些更精细的类别之间非常相似,而同个类别则可能由于遮挡、角度、光照等原因就不易分辨。
目标检测/Object Detection/
目标检测通常包含两方面的工作,首先是找到目标,然后就是识别目标。
目标检测可以分为单物体检测和多物体检测,即图像中目标的数量,例子如下所示
图像分割/Object Segmentation/
图像分割是基于图像检测的,把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。
图像分割可以分为三种:
1.普通分割:将不同分属于不同物体的像素区域分开,比如前景区域和后景区域的分割。
2.语义分割:普通分割的基础上,在像素级别上的分类,属于同一类的像素都要被归为一类,比如分割出不同类别的物体。
3.实例分割:语义分割的基础上,分割出每个实例物体。
图像重构/Image Reconstruction/
图像重构,又称图像修复,它的目的就是修复图像中缺少的地方。可以用来修复一些老旧的照片影像。
图像生成/Profile/
图像生成就是根据一张现有图片修改其部分区域,使其生成一张全新的图片。
风格迁移/Style Transfer/
风格迁移是指将一个领域或者几张图片的风格应用到其他领域或者图片上。比如将抽象派的风格应用到写实派的图片上。
超分辨率/Super-Resolution/
超分辨率是指生成一个比原图分辨率更高、细节更清晰的图片。
人脸
人脸方面的应用,包括人脸识别、人脸检测、人脸对齐等等,日常生活中被广泛应用于各种身份认证、安全认证等,如人脸支付,人脸解锁,人脸闸机。