时间:2019/3/23
内容:
1.计算机视觉概述
2.计算机视觉历史背景
课时1:计算机视觉概述
- 若无基础,可先学习CS131(深度学习、自然语言处理)
- CS231a 更全面,涉及3D重建、匹配和机器人视觉等方面
- 本课程主要是神经网络(特别是CNN),并将其应用于各种视觉识别任务
课时2:计算机视觉历史背景
-
Block word
视觉世界被简化为简单的几何形状,目标是识别它们 -
《Vision》 David Marr
-
如何越过block world,开始识别或表示现实世界对象
基本思想:每个对象都由简单的几何图单位组成。将物体的复杂结构简化成有更简单形状和结构的集合体 -
如何重建和识别由简单的物体结构组成的视觉空间
基本思想:通过线和边缘重构 -
目标识别太难,首先要做目标分割
基本思想:把每一张图片中的像素点归类到有意义的区域(图算法) -
面部检测
统计机器学习:SVM,boosting,图模型,AdaBoost算法(实时面部检测) -
早期目标识别
基本思想:基于特征(SIFI特征,匹配整个特征) -
识别整幅图的场景
算法:空间金字塔匹配
基本思想:图片中的各种特征可以告诉我们这是那种场景,该算法从图片的各像素抽取特征,并把它们放在一起,作为一个特征描述符,然后再特征描述符上做一个支持向量机 -
辨识人体姿态
方向梯度直方图,可变形部件模型 -
21世纪早期目标识别
拥有标注的数据集(例如PASCAL Visual Object Challenge)