图片分析系统（一）机器视觉和图片数据化-CSDN博客

本文链接：https://blog.csdn.net/primeregion/article/details/132740167

本文探讨了机器视觉的发展历程，包括其定义、应用分支如目标制导和图像分析，并介绍了图像数据化的两种形式：像素图和矢量图，强调了它们各自的优缺点以及在不同场景下的适用性。

摘要由CSDN通过智能技术生成

机器视觉
机器视觉是人工智能正在快速发展的一个分支。简单说来，机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是通过机器视觉产品(即图像摄取装置，分CMOS和CCD两种)将被摄取目标转换成图像信号，传送给专用的图像处理系统，得到被摄目标的形态信息，根据像素分布和亮度、颜色等信息，转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征，进而根据判别的结果来控制现场的设备动作。
机器视觉的研究是从20世纪60年代中期美国学者L.R.罗伯兹关于理解多面体组成的积木世界研究开始的。当时运用的预处理、边缘检测、轮廓线构成、对象建模、匹配等技术，后来一直在机器视觉中应用。罗伯兹在图像分析过程中，采用了自底向上的方法。用边缘检测技术来确定轮廓线，用区域分析技术将图像划分为由灰度相近的像素组成的区域，这些技术统称为图像分割。其目的在于用轮廓线和区域对所分析的图像进行描述，以便同机内存储的模型进行比较匹配。实践表明，只用自底向上的分析太困难，必须同时采用自顶向下，即把目标分为若干子目标的分析方法，运用启发式知识对对象进行预测。这同言语理解中采用的自底向上和自顶向下相结合的方法是一致的。在图像理解研究中，A.古兹曼提出运用启发式知识，表明用符号过程来解释轮廓画的方法不必求助于诸如最小二乘法匹配之类的数值计算程序。
70年代，机器视觉形成几个重要研究分支：
①目标制导的图像处理；
②图像处理和分析的并行算法；
③从二维图像提取三维信息；
④序列图像分析和运动参量求值；
⑤视觉知识的表示；
⑥视觉系统的知识库等。

图片数据化
计算机的本质是“0”和“1”，它没有眼睛，没有视网膜和视觉神经，不能看到图片。要想让计算机识别图片就必须先把图片变成计算机能“读懂”的数据。
数字图像处理的历史可追溯至二十世纪二十年代。最早应用之一是在报纸业，当时，引入巴特兰电缆图片传输系统，图像第一次通过海底电缆横跨大西洋从伦敦送往纽约传送一幅图片。为了用电缆传输图片，首先进行编码，然后在接收端用特殊的打印设备重现该图片。按照1929年的技术水平，如果不压缩，需要一个多星期，压缩后传输时间减少到3个小时。
图片数字化的形式通常有两种，一种是将图片细分成无数个小方块，每个小方块为一个像素单位，一个像素只表示一种颜色。图片是一个二维的平面，用一个二维函数f（x，y）来表示最为直观，x和y作为平面的坐标，每个坐标对应一个像素数据，即可将整张图片以数据的形式记录。现在的照片、画作基本都是以像素图的形式数字化保存。
这种像素图形式有一个缺点，就是一旦将图片放大到某种程度，就会显示成多个方块组成的“马赛克”，想要清晰的图片就得增加像素的数量，像素数量越大，占用的空间也就越大。有的时候，我们需要高清的大图片，有的时候，我们又只需要低清晰度的小图片以节约空间。一张像素图的像素数是固定的，如果要调整清晰度就必须重新生成一张像素图，颇为不便。
为此，数字图片还有另一种记录形式——矢量图。在数学上定义为一系列由点连接的线。矢量文件中的图形元素称为对象。每个对象都是一个自成一体的实体，它具有颜色、形状、轮廓、大小和屏幕位置等属性。矢量图记录了点的运动轨迹，每次显示都相当于将图重新画一遍，因此无论什么样的尺寸、清晰度，占用的空间都是一样的。对于一些结构简单的图片，比如商标、队徽、公司logo等就很适合用矢量图保存。而对于复杂的照片来说，点的轨迹过于庞大复杂，空间占用比像素图更夸张，就不适合了。