1.基本概念:
计算机视觉是指用计算机实现人的视觉功能,主要针对对客观世界三维场景的感知、识别和理解。计算机视觉的目标是使计算机具有通过二维图像认知三维环境信息的能力,不仅需要使计算机能够感知三维环境中物体的几何信息(包括形状、位置、运动等),而且能对信息进行描述、存储、识别和理解。
2. 计算机视觉的关键任务:
- 物体识别:识别图像物体属于的类别
- 物体检测:用框去标出物体的位置,并给出物体的类别
- 分类/定位:分类即给输入图像分配标签,定位即找到图像中某一目标物体在图像中的位置
- 图像分割:将数字图像细分为多个子区域(超像素,ROI)