计算机视觉的历史:
1. 1963年,Larry Roberts 发表了世界上计算机视觉领域的第一篇博士论文 ’’Block World”,其中视觉世界被简化简单的几何图形,以实现这些形状的识别和重建。
2.1966年,MIT的The Summer Vision Project被提出,试图利用暑假时间来有效地构建视觉系统的重要组成部分。
3.19世纪70年年代后期,David Marr撰写了著名的”Vision”,介绍了他是如何理解视觉的、我们应该如何处理计算机视觉开发甚至如何可以使计算机识别视觉世界的算法。
为了拍摄一幅图像并获得视觉世界的最终全面的3D表现必须经历的步骤:输入图像(感知到的亮度图片)→ 原始草图(大部分斑点、边缘、端点、虚拟线条、曲线边界等都被用其他元素来表示)→ 2.5维草图(我们开始将表面、深度信息、层或者视觉场景的不连续性拼凑在一起) → 3维模型(根据表面和体积图等分层组织)
4.19世纪70年代,计算机科学家们提出的”How can we move beyond the simple block world and start recognizing or representing real world objects?”问题促进了General cylinder(广义圆柱体)和Pictorial structure(图形结构)想法的产生,即将物体的复杂结构简化为一个集合体,每个集合体有更简单的形状和几何结构。
5.19世纪80年代,David Lowe开始思考”How to reconstruct or recognize the visual world from simple world structures”的问题,并通过线和边缘尝试构建剃须刀。
6.1997年,Shi 和Malik创新性地开始研究Objection segmentation的问题,将一张图片中的像素归类到有意义的区域,若将属于人的像素点从背景中抠出来,即图形分割
7.1999-2000年机器学习技术,特别是统计机器学习方法开始加速发展,Paul Viola和Michael Jones开始提出使用AdaBoost算法进行实时面部检测;五年后(2006年),基础科学研究快速转化为了实际应用,富士推出了世界上第一款可以实时实现面部检测的数码相机。
8.在20世纪90年代末到21世纪前十年,一个非常有影响的思想方法为”Feature BasedObject Recognition”(基于特征的目标识别),其中David Lowe提出了SIFT特征,即目标识别时,先确定目标具有表现性、不变性的关键特征,然后将这些特征与相似的目标进行匹配。
9.空间金字塔匹配:图片中有各种特征,算法从图片的各像素抽取特征,并把他们放在一起作为一个特征描述符,然后在特征描述符上做一个支持向量机。
10.HoG(方向梯度直方图)和Dedormable Part Model(可变形部件模型)
11.直到21世纪早期,对于Object Detection,我们才开始真正拥有Benchmark Data set(标注数据集),供我们衡量在Object Detection方面取得的成功,其中最具影响力的Benchmark Data set之一为PASCAL Visual Object Challenge。
12.Image-net数据集与Large Scale Visual Recognition Challenge
2012年,Convolutional Neural Network(卷积神经网络)算法被提出,使得错误率下降了将近一半。