计算机视觉技术是一项人工智能化的技术,它是模拟人类对环境进行感知的过程,因此它是一个跨学科的交叉领域,其中包括图像处理、人工智能、数字化技术等。又被称为图像理解,说直白一点便是利用相关的图像处理方法去得到人们想要的图像信息。
目前计算机技术已经能够对二维图像进行分析和处理,对于二维图像中的内容进行识别和分析,但是在具体的应用过程中,人类希望计算机能够对三维结构进行更加深入的分析以满足人类的智能需求。
计算机视觉技术的主要研究内容和目的主要有三点:
一是通过对于图像的数据分析,利用图像中的参照物对物体间的距离进行计算,从而得到图像中的距离数据。
二是对图像进行分析,通过对于图像中的数据了解到物体在运动时的一些运动参数。
三是通过对图像的计算和分析了解到图像中特定物体所具备的一些物理特性和相关参数。
通过以上三点数据,便能够对图像中的特定物体进行深入地了解,得到物体的相关具体信息,但是由于目前计算机无法实现对于三维图像的识别,通常要将其转化为二维图像的投影,通过一幅或多幅二维图像投影来实现对物体数据的分析。
首先视觉技术的主要目的便是实现对图像的识别和处理,计算机视觉技术的图像处理方法 :
1.图像变换 (利用函数的方式,将图像中的各种信息变换为便于计算机计算和处理的信息,计算机对图像信息的识别和处理的技术前提)
2.图形增强 (算法对原有的图像进行修饰和加工,提供更好的视觉效果)
3.图像恢复(借助图像信息的处理手段提升图像质量)
4.图像编码 (图像数据量太大,保存图像关键特征的前提下压缩图像)
5.图像边缘锐化 (修饰图像的各种细节,使图像类的物体有明显的边界,便于后面的图像处理和观测等工作)
6.图像分割(将图像分割成若干特征区域,标记赋予不同区域特定的含义和编号,便于实现图像分析工作)
7.图像识别(利用相关的算法和识别方法,对于图像中的内容进行分类识别)
从技术层级的角度来说,计算机视觉 可分为低层视觉和高层视觉:
低层视觉包括图像或视频的拍摄、信号预处理、分割等;高层视觉则包括对场景信息的检测、识别、跟踪等。
计算机视觉 的核心任务是将实际场景中拍摄到的图像进行特征提取,得到特定的数值或符号信息,再根据这些数值或符号做进一步的检测或者识别,并将结果以决策的形式来表现。
计算机视觉的子领域 包括场景重建、事件检测、视频跟踪、目标识别、3D姿态估计、运动估计和图像复原。
近年来,计算机视觉 方面的研究工作则聚焦于基于特征的方法,并与深度学习技术和最优化理论进行了结合,例如深度神经网络、循环神经网络、卷积神经网络、生成式对抗网络等等。这些基于深度学习的方法在数据量大的图像集上取得了比传统方法更好的效果。尤其是它与发展迅速的机器学习方法相结合 ,目前已上到了新台阶,并且广泛应用于社会实践当中。
计算机视觉技术的三大关键任务:
1.目标检测与识别:计算机视觉中最经典的问题就是判断图像数据中是否包含某种特定的目标、特征或者活动。根据识别结果的精细度划分:目标检测、目标识别、目标鉴别、
2.运动分析:划分为自身运动估计、目标跟踪、光流估计
3.场景重建:所谓场景重建,是指通过一幅或者多幅图像或视频来计算出场景的三维空间模型。目前的场景重建算法可以把多个三维图像拼接到数据点云和三维模型中,从而得到尺寸更大的三维图像。