生物视觉:
生物物种大爆发的原因--------视力的产生,视力促进了智慧生物的生存和发展。
机器视觉:
相机的诞生
计算机视觉:
由Larry Roberts 发表的论文Block World被认为是计算机视觉的第一篇论文,1966年的MIT暑假项目:The Summer Vision Project,试图在那个夏天解决大部分视图系统中的问题,50年后,仍有数千名研究人员在为之努力,解决一些基本问题。
David Marr在70年代后期,撰写了计算机视觉书籍,他提出从拍摄一幅图像到获得最终的3D模型,需要经历以下4个过程----输入图像->原始草图->2.5维->3D模型,这种思考方式影响了视觉世界10几年。
80年代,计算机科学家也开始思考计算机如何识别物体,David Lowe尝试识别剃须刀,但是60-80年代对图像识别的研究都是在少量样本的情况下,故进展不大,没有应用。之后科学家转换思路,如果图像识别还很困难,那么先将目标从图像中分割出来,也就是图像分割。
1999-2000机器学习加速发展,2001Paul Viola和Michal Jones研究出AdaBoost算法进行实时面部检测,五年后,2006年富士康就推出了 第一个能够实现实施面部检测的数码相机,可见从基础科学研究到实际应用的转化很快。
90年代末至00年代,基于特征的目标识别开始快速发展,其中有名的研究工作是David Lowe完成的“SIFI”特征,他抓住了某些在变化中具有表现性和不变性的特征,识别目标图像上的这些特征并将其与标志进行匹配就可以实现目标识别。另一个研究方向是识别整个图像的场景,一种算法是空间金字塔匹配。
在计算机视觉的发展的历程中,图片的质量也在不断地提升,所以目标检测在21早期得到快速发展,并构造了一个经典图像数据集,imagenet。ImageNet还开展了一项目标检测比赛,The Image Classification Challenge,比赛中的识别错误率逐年下降,直到2015年,错误率比人工识别错误率低了,值得注意的是,在2011年到2012年,错误率显著下降10%,这一年卷积神经网络算法打败其他算法,并发展至今已经成为最火的研究方向之一,即深度学习。
卷积神经网络(CNN)
1998年就有科学家发明过类似的方法,而直到2012年的The Image Classification Challenge比赛中,卷积神经网络算法才大获成功,原因主要有两点:
- 卷积神经网络算法对计算机算力的要求很高,所以直到2012年左右计算机算力才足以实现这种算法。
- 从1998到2012,数据量的提升也促使这种算法的发展,包括大量带标签的数据集的出现,如ImageNet。
自从2012年之后,CNN的性能不断提高,层数也不断增大,可达到200多层,需要计算机图像处理的性能也不断加大。