计算机视觉之历史漫说

1、概要

  计算机视觉不是自古以来就有这样成就的,而是经历了很多代研究人员艰辛探索才有了今天这样成就。计算机视觉是一个综合性学科,其发展不仅有自身算法的发展,也大大得益于其他领域的发展,如计算机硬件、神经生物学、互联网等等。在聊到视觉时候,很多人都忽略了视觉算法处理对象也就是图像的发展,没有图像就不会有计算机视觉。因此本文主要了解图像获取和算法发展两个方面的历史。

2、图像获取

2.1 相机

  图像获取有两种方式:绘画和拍照。计算机视觉中处理的图像使用相机拍照而来的。从第一个相机出来到现在有接近200年。
  世界上第一张在感光材料上城乡的照片时1827年法国的约瑟夫·尼塞福尔·涅普斯拍摄出来的,花了八个小时的曝光,而且图像质量也很低劣,内容不清晰,如下图的左图。1839年法国人达盖尔利用水银蒸汽对曝光的银盐涂面进行显影作用的方法。这种方法拍照时长缩短到大约30分钟,照片质量也有很大提升,影纹细腻、色调均匀、不易褪色等等有点。如下图的右图。虽然进步很大,但是一次拍照要拍20-30分钟,如果是拍人物,一个人就要傻傻的摆个姿势,要20分钟,什么姿势都要累死。钻研过摄影的人应该清楚:快门时间越长,如果相机抖动会导致图像模型,动的东西也会模糊。这时候的照片都是黑白的。而且水银是有毒物质,容易导致摄影师中毒。照片复制也很困难,成本也很高。

早期黑白图片
  银版摄影法一直流行到湿版摄影法被发明出来。湿版摄影法是由英国人弗雷德里克·斯科特·阿彻在1851年发明的。湿版摄影需要在完全湿润的状态下进行所有操作,包括曝光和显影,因此通常需要现场操作,摄影师常常需要带着一个暗房车(移动暗房)以便现场处理。湿版摄影法几乎克服了银版摄影法缺点,但又保存了其优点:细节好、尺寸大、毒性小、更廉价、感光速度快。因此湿版摄影法很快就流行起来。

  1871年,理查德·李奇·麦登逊在湿版摄影基础上发明了干板胶片,进一步简化了摄影过程。干版摄影解决了湿版摄影法中需要在曝光时保持玻璃板湿润的技术限制。干版摄影法使得摄影过程更加便捷,并且成为了现代摄影技术的基础之一。干版摄影法使用的是干燥的感光板,而不是像湿版摄影那样需要湿润的玻璃板。这种感光板上涂有一层光敏材料(通常是溴化银),可以在干燥的状态下保持感光性,因此可以在不需要暗房的情况下进行拍摄。干版摄影不需要像湿版摄影那样在现场立即处理感光材料,因此摄影师可以在更广泛的环境下进行拍摄。玻璃板可以预先准备好,并在拍摄前数周甚至数月后使用。相机的曝光步骤和湿版类似,光线通过镜头作用于涂有感光乳剂的玻璃板。干版摄影法极大地促进了摄影的普及和应用。由于其方便的操作,摄影师可以更加灵活地捕捉图像,而不必像湿版摄影法那样受限于暗房的使用和即时的操作。这种技术的发明为商业摄影、户外摄影和科学摄影带来了革命性的变化。
  世界上第一张彩色照片是由物理学家詹姆斯·麦克斯韦在1861年拍摄并印刷的,下图即当时拍摄的图像。他提出用三原色(红绿蓝)可以混合出世间任意一种颜色。这张世界上第一张彩色照片展示的是一块苏格兰格子布,尽管因为当时的技术限制,图像的细节和色彩还不够完美,但它代表了彩色摄影技术的开始。这一实验验证了麦克斯韦的颜色理论,并开启了彩色摄影的探索之路。虽然麦克斯韦的彩色图像并不是通过现代的彩色胶片技术生成的,但它是世界上第一张成功合成的彩色图像。这一成就奠定了日后彩色摄影发展的理论基础。

第一张彩色图片
  普通人能够用上相机得益于胶卷的出现。胶卷是柯达公司再1888年推出的,具有柔软、可卷绕的特性。柯达相机使用了一卷预先装好的胶卷,可以拍摄多达100张照片。拍摄完成后,摄影师只需将相机寄回工厂,工厂负责冲洗、印刷和重新装胶卷。虽然彩色成像已经出现了,但此时胶卷拍的还是黑白图像。20世纪初彩色胶卷才逐步发展起来,到20世纪中期胶卷成了主流的摄影载体。

  我们现在用基本上都是数码成像。在20世纪60年代末NASA和贝尔实验室等机构开始探索数字成像技术,主要用于空间探索和科学实验。世界上第一台数码相机是由柯达公司工程师史蒂夫·萨森于1975年发明的。这台相机使用了一个CCD传感器,并将拍摄的图像存储在磁带上。它的分辨率非常低,仅有0.01百万像素(100×100像素)。虽然这台相机体积庞大且功能有限,但它代表了数码摄影技术的诞生。经过几十年的发展,数码相机全面替代了胶卷相机,并通过手机进入千家万户。

2.2 数字图像

  计算机先驱Russell Kirsch在年轻时候想如果让计算机能够看到图片,将会怎样。1957年他在NIST上班时候和他同事一起创造了世界上第一张数字图片,图片的内容是他三个月大的孩子,如下图所示。真正数字图像的发展不仅仅需要传感器(CCD、CMOS)的进步,也需要数字图像处理的发展。图像编解码(jpg、png)、视频编解码技术(h264, h265)的进步发展,能够将传感器获得的图像、视频进行编码,降低网络传输的带宽需求,使得图像、视频能够在网络上大规模的传输与观看。

第一张数字图片

3、计算机视觉算法

  任何一个领域都有一个或若干个开山祖师,至少名流这个领域,后续研究者可随时瞻仰。计算机视觉领域比较奇怪,很多人不知道计算机视觉的开派祖师。
  1963年,一个年轻人发表了“Machine perception of three-dimensional solids”。主要研究如何从二位图像中获取刚体的三维信息,如下图所示。按照5年时间算,1958年就开始研究视觉。也就是说在第一张数字图片出来之后不到一两年就有人研究如何用计算机来看图像了。这个人叫 Lawrence Roberts,是领域内大家认可的计算机视觉之父。但是创派祖师却去搞互联网了,没有继续从事计算机视觉。可以看到那时候其实大家对计算机视觉并不看好。

第一篇视觉论文的部分图
  计算机视觉发展经历了几个阶段。个人分了几个阶段:

1)黑暗阶段:这个阶段到20世纪末。这个阶段主要是图像处理方法,利用图像处理的方法来理解图像中的内容。但是没有什么效果特别好的算法。想想开派祖师都投靠别派了。
2)黎明前的黑暗(机器学习阶段):这个阶段差不多到2010年。机器学习阶段有两个影响很大的计算:haar+adaboost和hog+SVM。机器学习阶段可以简单学习数据的规律,在学习之前,用特征工程获取图像的有效特征。特征工程是人工来实现的。
3)黎明阶段(深度学习阶段):我们现在就处在深度学习阶段。深度学习从2012年开始引起学界广泛关注。这个阶段把大量数据喂给算法模型,让模型自己学到所需要的特征,并理解这些特征。

4、总结

  计算机视觉发展至今,已经有了相对比较广泛的应用,而能取得如此成就离不开各个相关领域的发展,如计算机、互联网、认知学科、相机等等。很多偶然的发现、发展,经过无数人的努力,才慢慢发展到我们所看到的、习以为常的应用。如在早期照片上使用视觉算法很可能也是效果不佳,只有经过不断改进,成像质量越来越高,才使得算法的应用成了可能;如果没有计算机技术的快速发展,再好的算法也无法商用起来。也许,某天有更好的成像设备,用现在的算法,能够极大的提升算法的效果。
  计算机视觉远远为达到我们所想要的目标,虽然现在大模型取得了很大的成就,一些媒体资料总喜欢用夸大的口吻说算法超过人类,但仅仅只是这些媒体博取眼球之举。算法超过人类在10多年前就有,在人脸识别领域,但是即使是现在,人脸识别在很多情况下还是很不可靠的,而人在这些情况却可以轻易的识别。但是不可否认,计算机视觉也确实提升了很多工作的效率,如用人脸识别抓捕逃犯,用视觉算法之前,需要从1万张图片中把人找出来,但是用了视觉算法,可能只需要从10张或100张图片里进行人工挑选。
  计算机视觉属于人工智能的一大领域,其发展和人工智能领域的发展也是相互促进,人工智能领域其他子领域(如NLP)和视觉领域的方法可以互相借鉴、使用。等到人工智能大规模在日常生活中使用,也许那时候也是计算机视觉的大成之时。

  • 21
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值