原创:杨其泓
1. 计算机视觉
1.1. 什么是计算机视觉
计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学, 更进一步地说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和 测量的科学。近几年计算机视觉技术实现了快速发展,其主要学术原因,是2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别准确率首次超过人类,使之具真正具有了实际应用的能力(要不然别人会说:你找几个人来干不是更好吗),同年Google也开源了自己的深度学习算法。
计算机视觉的众多实际应用,细化下来都可以拆分成某个具体任务。
计算机视觉四大任务
- 图像分类:把图像划归为若干个类别中的某一种
- 图像分类+定位:把图像划归为若干个类别中的某一种,并给出被分类物体的位置
- 物体检测:用框去标出图像中物体的位置,并给出物体的类别(人脸检测、安全帽检测、车辆检测都属于这个)
- 图像分割:以像素级单位把图像分成若干个特定的、具有独特性质的区域并给出物体的类别(车道线分割项目就是用的这个,属于自动驾驶的一部分)
1.2. 基本任务流程
计算机视觉任务的主要流程有图像获取、预处理、特征提取、检测/分割和高级处理共计5个步骤。