前言:Hello大家好,我是小哥谈。计算机视觉是人工智能领域中的一个重要分支,通过使用算法和模型来使计算机能够理解和解释图像和视频数据。本文将介绍计算机视觉的基本概念、实现原理、8 个任务和 4 个生活中常见的应用场景。🌈
目录
🚀1.计算机视觉的概念
计算机视觉是一门研究如何使机器"看"的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取'信息'的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个"决定"的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中"感知"的科学。🌴
它是一门综合性的科学技术,主要包括计算机科学与工程、信号处理、物理学、应用数学与统计、神经生理学和认知科学等。 目前,计算机视觉技术已经应用在制造业、工业检验、文档分析、医疗诊断、军事目标跟踪、自主导航等系统当中。🌴
计算机视觉是在20世纪50年代从统计模式识别开始的。当时的工作主要集中在二维图像分析和识别上,如光学字符识别、工件表面、显微图片和航空图片的分析和解释等。60年代,Roberts(1965)通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述。到了70年代,已经出现了一些视觉应用系统。70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”(Machine Vision)课程,由国际著名学者B.K.P.Hom教授讲授。80年代以来,计算机视觉的研究已经历从实验室走向实际应用的发展阶段。而计算机工业水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究。目前,计算机视觉技术正在广泛的应用于计算几何、计算机图形学、图像处理、机器人学等多个领域中。🌴
计算机视觉就是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力,但是这是要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。🌴
🚀2.计算机视觉的应用
作为一个工程学科,计算机视觉寻求基于相关理论与模型来建立计算机视觉系统。这类系统的组成部分包括:
- 程序控制(例如工业机器人和无人驾驶汽车)
- 事件监测(例如图像监测)
- 信息组织(例如图像数据库和图像序列的索引建立)
- 物体与环境建模(例如工业检查,医学图像分析和拓扑建模)
- 交感互动(例如人机互动的输入设备)
等等...🍉 🍓 🍑 🍈 🍌 🍐
计算机视觉同样可以被看作是生物视觉的一个补充。在生物视觉领域中,人类和各种动物的视觉都得到了研究,从而建立了这些视觉系统感知信息过程中所使用的物理模型。另一方面,在计算机视觉中,靠软件和硬件实现的人工智能系统得到了研究与描述。生物视觉与计算机视觉进行的学科间交流为彼此都带来了巨大价值。计算机视觉包含如下一些分支:画面重建,事件监测,目标跟踪,目标识别,机器学习,索引建立,图像恢复等。视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战(grand challenge)。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号、纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。现在计算机视觉已成为一门不同于人工智能、图像处理、模式识别等相关领域的成熟学科。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。🍃
由于计算机视觉技术具有非接触、获得信息量大、作用距离远等特点,特别是随着计算机图像处理技术的不断发展,近几十年来,它在工业、农业、科学研究、军事等方面都获得了十分广泛的应用。下面主要介绍一下计算机视觉技术在工业检测中的应用概况。
- 工业检测:图像识别技术在工业领域的应用,主要用于能够代替人眼的计算机系统。在高速、大批量、连续自动化生产流水线,往往需要视觉系统进行质量检查、零件辨识和尺寸测量;
- 医疗:B 超、CT、X 光、ECT、内窥镜、病理分析、医学影像、血管造影,细胞图像分析系统等。采用医疗图像分析系统,可对血液细胞自动分类计数、染色体分析、癌症细胞识别等;
- 公安:指纹识别、痕迹辨认、电子警察、图像自动跟踪、安全监控等;
- 金融:印章支票真伪判别、票证处理、柜员机自动检测、金库监控、运钞车现场自动检测与传输等。其中纸币印刷质量检测系统利用图像处理技术,通过对纸币生产流水线上的纸币20 多项特征(号码、盲文、颜色、图案等) 进行比较分析,检测纸币的质量,从而替代传统的人眼辨别的方法;
- 交通:汽车车牌识别、高速公路收费、违章闯红灯检测、交通管制系统等。采用智能交通管理系统,通过在交通要道放置摄像头,当有违章车辆(如闯红灯) 时,摄像头将车辆的牌照拍摄下来,传输给中央管理系统,系统利用图像处理技术对拍摄的图片进行分析,提取出车牌号存储在数据库中,然后可以供管理人员进行检索;
- 商标管理:可以建立商标图像库,利用图像检索技术,对新申请的商标与图像库里的注册商标进行分析,检查是否设计相似或雷同。
等等...🍉 🍓 🍑 🍈 🍌 🍐
🚀3.计算机视觉系统
计算机视觉系统的结构形式很大程度上依赖于其具体应用方向。有些是独立工作的,用于解决具体的测量或检测问题;也有些作为某个大型复杂系统的组成部分出现,比如和机械控制系统,数据库系统,人机接口设备协同工作。计算机视觉系统的具体实现方法同时也由其功能决定——是预先固定的抑或是在运行过程中自动学习调整。🌷
尽管如此,有些功能却几乎是每个计算机系统都需要具备的:
(1)图像获取:一幅数字图像是由一个或多个图像感知器产生,这里的感知器可以是各种光敏摄像机,包括遥感设备,X射线断层摄影仪,雷达,超声波接收器等。去绝不与同的感知器,产生的图片可以是普通的二维图像,三维图组或者一个图像序列。图片的像素值往往对应于光在一个或多个光谱段上的强度(灰度图或彩色图),但也可以是相关的各种物理数据,如声波,电磁波或核磁共振的深度,吸收度或反射度。
(2)预处理:在对图像实施具体的计算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采用来使图像满足后继方法的要求。例如:二次取样保证图像坐标的正确,平滑去噪来滤除感知器引入的设备噪声,提高对比度来保证实现相关信息可以被检测到,调整尺度空间使图像结构适合局部应用
(3)特征提取:从图像中提取各种复杂度的特征。例如:线,边缘提取;局部化的特征点检测如边角检测,斑点检测;更复杂的特征可能与图像中的纹理形状或运动有关。
(4)检测/分割:在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,例如筛选特征点;分割一或多幅图片中含有特定目标的部分。
(5)高级处理:到了这一步,数据往往具有很小的数量,例如图像中经先前处理被认为含有目标物体的部分。这时的处理包括:验证得到的数据是否符合前提要求;估测特定系数,比如目标的姿态,体积;对目标进行分类。
🚀4.计算机视觉的发展趋势
目前我国计算机视觉还未进入技术发展的下半场,未来随着计算机视觉技术在人脸识别上性能的不断突破,限定场景识别准确率将不断提升,愈来愈多的对象识别、分类问题将会逐步实现工业化,渗透进更多的行业应用。整体而言,计算机视觉技术要想更好的实现应用落地,需要在对具体业务场景的理解之上进行针对性开发,以提供更加全面、及时的服务,这要求计算机视觉企业未来在重视前沿算法研发的同时,需要进一步加强算法和商业应用的融合。此外,随着我国人脸识别、物体识别等分类、分割算法精度日益提升,愈来愈多的对象识别、分类问题将会逐步实现工业化,渗透进更多的行业应用。未来医疗影像、智慧物流、工业制造、批发零售等创新应用领域也将进一步解锁,成为行业整体快速发展的重要支撑。🌿
我们可以将计算机视觉的发展趋势简单的概括为以下几点:
- 检测精度、速度将随着CCD/CMOS和芯片技术的进一步增加。
- 随着算法技术研究的深入,功能会进一步增加。
- 应用领域不断扩展到医药、零件制造、生物、航天等行业。
- 专门、单一功能的视觉传感器将在特定区域内大有作为。
- 系统更小,与芯片技术发展相关。
- 速度更快。
- 系统更简易实用、更便宜。
- 系统被“设置”,而不是被“编程”。
- 系统将生成自动或半自动的可执行代码。
- 3D算法工具将有很多应用。
等等...🍉 🍓 🍑 🍈 🍌 🍐
🚀5.结束语
在未来几年内,随着中国加工制造业的发展,对于计算机视觉的需求必将逐渐增多。随着计算机视觉产品的增多、技术水平的提高,国内计算机视觉的应用状况将产生质的变化,将由初期的低端应用转向更高级应用领域。🌿