数字图像处理

wq0455

于 2024-09-02 17:43:35 发布

阅读量339

点赞数 11

分类专栏：数字图像处理——使用MATLAB分析与实现文章标签：计算机视觉人工智能图像处理

本文链接：https://blog.csdn.net/wq0455/article/details/141806804

版权

数字图像处理——使用MATLAB分析与实现专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、视觉与图像

视觉是人类观察世界和认知世界的重要手段，人类从外界获得的信息绝大部分是由视觉获取的。
图像是视觉信息的重要表现方式，是对客观事物的相似、生动的描述。
人的视觉系统十分完善，灵敏度高、作用距离远，传播速度快，再加上大脑的思维和联想能力，使得图像信息具有直观形象、信息量大、利用率高的特点；而且，除了可见光以外，红外线、紫外线、微波、X射线等非可见光也能够成像。

二、图像的表示

从信息论的角度来看：图像是一种二维信号，可以用二维函数 $f (x, y)$ 来表示，其中 $x ， y$ 是空间坐标， $f (x, y)$ 是点 $(x, y)$ 的幅值。
视频又称动态图像，是多帧位图的有序组合，可以用三维函数 $f (x, y, t)$ 表示，其中 $x ， y$ 是空间坐标， $t$ 为时间变量， $f (x, y, t)$ 是 $t$ 时刻某一帧上点 $(x, y)$ 的幅值。
图像可以分为两种类型：模拟图像和数字图像。
模拟图像是指通过客观的物理量表现颜色的图像，如照片、底片、印刷品、画等，其空间坐标值 $x$ 和 $y$ 连续，在每个空间点 $(x, y)$ 的光强也连续，无法用计算机处理。对模拟图像进行数字化得到数字图像，才可以用计算机存储和处理。
数字图像是由有限的元素组成，每一个元素的空间位置 $(x, y)$ 和强度值 $f$ 都被量化成离散的数值，这些元素称为像素。因此，数字图像是具有离散值的二维像素矩阵，能够存储在计算机存储器中。
在这里插入图片描述

三、数字图像处理

（一）数字图像处理的主要内容

1. 图像获取

图像获取是指通过某些成像设备，将物体表面的反射光或通过物体的折射光转换成电压，然后在成像平面形成图像，通常需要经过模数转换实现数字图像的获取。

2. 图像基础处理技术

图像基础处理技术包括图像变换。图像增强、图像平滑、边缘检测与图像锐化以及图像复原等。

图像变换：是对图像进行某种正交变换，将空间域中的图像信息转换到如频域、时频域等变换域，并进行相应的处理分析。经过变换后，图像信息的变形形式发生变化，某些特征会突显出来，方便后续处理，如低通滤波、高通滤波、变换编码等。
图像增强：目的是将一幅图像中的有用信息（即感兴趣的信息）进行增强，同时将无用信息（即干扰信息或噪声）进行抑制，以提高图像的可观察性
图像平滑：图像在获取、传输和存储过程中常常会受到各种噪声的干扰和影响，使图像质量下降，对分析图像不利。图像平滑是指通过抑制或消除图像中存在的噪声来改善图像质量的处理方法。
边缘检测与图像锐化：边缘检测是指通过计算局部图像区域的亮度差异，检测出不同目标或场景各部分之间的边界，是图像锐化、图像分割、区域形状特征提取等技术的重要基础。图像锐化的目的是加强图像中的景物的边缘和轮廓，突出或增强图像中的细节。
图像复原：图像复原是将退化了的图像的原有信息复原，以达到清晰化的目的。图像复原是图像退化的逆过程，通过估计图像的退化过程建立数学模型并补偿退化过程造成的失真。

3.图像压缩编码

图像压缩编码是指利用图像信号的统计特性和人类视觉的生理及心理特性，改变图像信号的表示方式，达到降低数据量的目的，以便存储和传输。图像编码的主要方法有统计编码、变换编码、预测编码、混合编码及一些新型编码方法。
在这里插入图片描述

4.图像分析

图像分析包含图像分割、图像描述与分析两部分内容。

图像分割：是指把一幅图像分成不同的区域，以便进一步分析或改变图像的表示方式，如卫星图像中分成分工业区、住宅区、森林等；人脸检测中需要分割人脸等。
图像描述和分析：是计算并提取图像中感兴趣目标的关键数据，用更加简洁、明确的数值和符号表示，突出重要信息并降低数据量，以便计算机对图像进行识别和理解。

5.图像综合处理技术

图像匹配：是指针对不同时间、不同视角或不同拍摄条件下的同一场景的两幅或多幅图像，寻找它们之间在某一特性上的相似性，建立图像间的对应关系，以便进行对准、拼接、计算相关参数等操作，应用需求广泛。根据考虑特性的不同，匹配方法可以分为基于灰度的匹配和基于特征的匹配。
图像融合：是信息融合的一个分支，通过算法将两幅或多幅图像合成为一幅新图像，最大限度地获取目标场景的各种特征信息描述，以增强和优化后续的显示和处理。
图像检索：指的是能够快速、准确地查找访问图像的技术，包括基于内容的的图像检索和基于特征的图像检索。
图像水印：是利用数据嵌入的方法将特定意义的标记隐藏在数字图像产品中，来辨别数据的版权或实现内容认证、防伪及隐蔽通信，是多媒体信息安全的内容之一。
立体视觉：是仿照人类利用双目线索感知距离的方法来实现对三维信息的感知。在实现上采用基于三角测量的方法，运用两个或多个摄像机对同一景物从不同位置成像，并进而从视差中恢复距离，重建三维场景。
目标检测与跟踪：目标检测是搜索图像中感兴趣的目标并获得目标的客观信息。目标跟踪是根据当前运动信息估计和预测运动目标的运动趋势，以便为后续识别提供信息。

（二）数字图像处理技术的分类

数字图像处理技术一般有三个层级：图像处理、图像分析和图像识别理解。

图像处理：是指对输入图像进行变换，改善图像的视觉效果或增强某些特定信息，是从图像到图像的处理过程。这类处理技术有降噪、增强、锐化、色彩处理、复原等。
图像分析：通过对图像中相关目标、相关内容进行检测和计算，获取某些客观信息，从而建立对图像的描述，以便对图像内容进行识别理解。图像分析是从图像到非图像（数据或符号）的处理过程，这类处理技术包括图像分割、图像描述和分析等。
图像识别理解：是利用模式识别的方法和理论，根据从图像中提取出的数据理解图像内容。常采用的方法有经典的统计模式分类方法、支持向量机及人工神经网络等。