第一章数字图像的概述

江夏四卯

于 2023-08-06 23:08:18 发布

阅读量1.5k

点赞数 11

分类专栏：数字图像处理学习笔记文章标签：人工智能

本文链接：https://blog.csdn.net/m0_46557382/article/details/132033817

版权

数字图像处理学习笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.1图像的概述

图像的简史：

1.1.1图像的本质和意义

视觉图像获取来源：

视觉图像来源于人眼系统和大脑皮层协同对宇宙中电磁能谱等粒子载体的吸收、过滤、转换与理解，人眼通过观测吸收可见光感知物理世界，同时也可通过其他感官或传感器感知宇宙的奥秘。

非视觉图象的获取来源：

伽玛射线成像（核医学，天文观测);
X射线成像（人体透视);
紫外波段成像（荧光显微镜);
可见光及红外波段成像（遥感);
微波波段成像（雷达);
无线电波成像（磁共振);
其他主要能源包括声波、超声波和电子（成像)

人类视觉系统：

外界物体表面反射的光线通过虹膜投射进入到眼球，然后经过玻璃体的传播，到达视网膜的中央凹，再转换成生物电脉冲，由视神经传播至大脑灰质层视觉区域，产生人类的主观“图像”!

图像的本质：

图像本质是外界光线刺激人类的大脑产生的主观印象。
“图"是外界事物的客观属性，是一种光线强度的统计分布，可以通过数学方法准确描述和定义。
“象”的原意是指形状和样子，外貌、肖像的统称。本课程中是人类大脑皮层通过生物电信号刺激而产生的一种内心世界主观感受。因此“象"是因人而异的，属于哲学研究的范畴。
图象的本质是一种能量信息交换，发送者和接收者之间通过某种媒体进行的能量信息传递。例如，颜色、姿势、手势、表情、绘画、文字、声音、敲击节奏等形式的，通常空气、岩石土壤、植物或动物、光粒子等作为能量信息传递的媒体，通过直接或间接方式传递能量信息达到新的宿主。

图像的意义：

图象就是人类种群和社会重要的通信交流方式。
图象对于人类来讲，既是一种对客观宇宙的主观理解和现实物理世界生存竞争的重要能力，也是人类文明维度进化的重要手段。
既可以是空间上，也可以是时间上的能量信息交流。

图像的特性：

图象是一种高级语言，是文明传承的重要载体

表达方法直观
表现力强

图象信息是人类信息获取和交流的主要方式

视觉占到信息获取的90%以上，其次是听、触、嗅、味

1.1.2图像的起源和发展

图像的起源和发展：

第一阶段，以原始绘画、象形记事为代表的图形图象起源;
第二阶段，以图画式符号、象形文字为代表语言图象表达;
第三阶段，以纸质绘画、印刷图象为代表的文化商业阶段;
第四阶段，以计算机数字化为代表的数字图象抽象表达。

1.1.3图像对人类社会的贡献

第一，加强了人类社会进步和文明进程;
第二，推进了文字符号、语言体系的发展;
第三，极大促进了相关科学的发展;
第四，催生了现代化数字产业、影视产业等高度发展。

问题讨论：

动物是否也能产生与人类一样的图象?
人类对图像的理解对人类文明有何意义?
谈谈图像如何有利于提高人类文明的维度?

课件：

1.2数字图像的简史

图像的起源与简史：

1.2.1数字图像的起源及发展重要阶段

第─阶段：以电子信号图像为标志的起源;

最早起源于1921年;
应用于报纸业;
通过海底电缆，将图像从伦敦传输至纽约，即“电子模拟图像传输”;
系统名称：“巴特兰”(Bartlane)，早期的该系统采用5个灰度级来编码图像，到了1929年扩展到15级。

第二阶段：以计算机数字化图像为标志;

1958年美国得州仪器公司开发了集成电路(IC);
20世纪70年代Intel微处理器的诞生;
20世纪70年代超大规模集成电路(VLSI)的应用;
上述事件标志着，使得数字图像真正开始了大规模应用和迅猛发展。此阶段最重要的贡献是解决机器感知问题。
1964年7月31日上午9点09分:“旅行者7号”拍摄的第一张月球图像。
1979年发明了“计算机轴向断层(CAT)技术”;
X光成像技术、ECT、MRI、SAR成像技术等;
在20世纪80年代初美国研制了第一款感知型二代机器人。数字图像处理技术极大促进了机器人工业化的进程。

第三阶段：以计算机结合人工智能技术技术为标志的数字信息智能感知阶段;

1980年代:随着计算机计算能力的不断发展，人工智能技术的爆发，数字图像处理技术呈爆炸性发展，如今已在大量军事国防、工业领域和服务领域应用空前繁荣，如:工业生产、生物医学领域、身份识别领域、航空航天领域、军事武器领域、资源遥感探测领域、深空探索领域等。

第四阶段：以智能传感技术、深度学习技术为标志的计算机自主识别、推理、规划和学习的智能决策阶段。

医疗服务、家庭服务、教育娱乐、勘探勘测、生物工程、救灾救援、深空/深海探测、智能交通、智能物流、智能超市、智能楼宇、智能工业机器人等领域扩展。这些应用都是数字图像处理技术在不同领域的深度融合的产物。

1.2.2数字图像的本质和意义

数字图像的本质就是各类传感器对物理世界的信息感知、量化、编码、重构、显示的结果。
图像信息不仅增强人类对客观世界的多维观察;也有利于计算机分析、理解、决策等应用需求。对人类提升适应生存环境能力具有重要意义。

1.2.3数字图像的来源

电磁幅射波包括：

紫外线：用于验钞、红外线热成像等;
γ射线：用于骨骼扫描、PET成像、反应器电子管成像等;
X射线：用于主动脉造影图像、头部CT、电路板等;
紫外线：用于谷物图像、星球图像等;
可见光与红外：用于照片、航拍图等;
无线电波：用于核磁共振图像等;
超声波：用于B超等。

数字图像的应用领域：

医学应用：X线片、CT(Computed Tomography i算机断层摄影术)、ECT、MRI;
气象预报：气象云图、台风探测、火山喷发图像;
地球资源勘探：资源遥感图像、灾害遥感图像;
空间探索：月球图像、黑洞图像、火星探索图像;
工业生产：资源勘探、工业机器人、探伤检测。
军事：卫星侦测、声纳图像、导弹制导等;
通信：视频、图像传真、无人机远程控制、深空探索;
公安：指纹识别、伪钞识别、面部识别、行为识别;
计算机合成图像：CG动画、影视作品特效、元宇宙;
广告设计：时装外观设计、服装试穿系统;

1.2.4数字图像的对人类社会的贡献

增强人类对物理世界的感知;
增强人类对人类社会的改造;
增强人类对宇宙诞生的认知;
增强人类对空间维度的提升。

课堂讨论：

人类如何通过视觉认知宇宙?
人类如何通过数字图象创立新的维度空间?
数字图象对人类社会的意义。

课件：

1.3数字图像处理技术意义与发展现状

1.3.1数字图像处理的意义

数字图像处理就是对图像信息进行加工以满足人的视觉心理需要的行为。图像处理的手段有光学方法和数学方法。一般而言，数字图像处理包括:画面提质、数据压缩、信息传播、信息识别、信息显示等环节。
数字图像处理可以大大提高人们的生活、工作、学习的效率，可以减轻人们的冗余工作强度，甚至可以部分代替人类的完成操作复杂、体力消耗型和危险性质的工作。

1.3.2数字图像处理的目标

提高图像的视觉质量，以达到赏心悦的目的。例如，去除图像中的噪声、增强图像对比度、老照片上色等。
提取图像中所包含的某些特征或特殊信息，以便于计算机分析。例如用作模式识别、计算机视觉的预处理等。例如，频率特征、灰度/颜色特征、边界/区域特征、纹理特性、形状/拓扑特性以及关系结构等。
对图像数据进行变换、编码和压缩，以便于图像的存储和传输。
图像人工智能应用。近年来随着深度学习网络技术的不断发展，在图像处理中占有重要的一席之地。替代了人工特征和简单分类器的功能，实现海量数据的自动化处理。

1.3.3数字图像处理的一般过程及方法

数字图像处理的一般过程：

数字图像处理的一般过程
数字图像处理的过程描述
数字图像处理技术的分类

数字图象处理的经典方法介绍：

第一步光学镜头成像系统;
第二步数字图像采样系统;
第三步数字图像编码系统;
第四步数字图像存储方式;
第五步数字图像显示方式。

数字图像处理技术的分类：

底层处理技术（数据处理)︰研究数字图像像素、频谱等性质，例如去噪技术、增强技术等;
中层处理技术（特征分析)︰研究数字图像特征抽取、特征表达的性质，例如特征模型、分类等;
高层处理技术（理解决策)︰研究目标语义、交互行为、事件理解与决策，例如语义模型、模式识别理论、行为理解等。

常见术语描述：

模拟图像(Analog lmage)：连续的，采用数字化(离散化)表示和数字技术出现之前，图像是连续的，这一类图像称为模拟图像或连续图像。
数字图像(Digital lmage)：由连续的模拟图像采样和量化而得。组成数字图像的基本单位是像素，所以数字图像是像素的集合。
数字化 (Digitizing)：将一幅图像从其原来的模拟形式转换成数字形式的处理过程，称作数字化。也称为/D转换。
像素(Pixel)：是数字图像的基本元素，像素是在模以图像数字化时对连续空间进行离散化得到的。每个像素具有整数行（高）和列(宽)位置坐标，同时每个像素都具有整数灰度值或颜色值。
空间分辨率(Spatial Resolution) ：描述图像数字化过程中对空间坐标离散化处理的精度，即图像中最小可分辨尺度。空间分辨率越高，数字图像所表达的景物细节越丰富，意味着数据量增加，同时图像数字化存储空间变大、传输带宽加大和算力处理的增大等不利因素。
亮度分辨率(Intensity Resolution)：在亮度级内最小可分辨的变化。
灰度/强度(Gray-level,等同于Intense):表示像素所在位置的光亮度/光强度，灰度值是在模拟图像数字化时对亮度进行离散化得到的数值。目前一般用强度来替代灰度。

常见采集设备简介：

数字视频采集卡
数字照相机
数字摄像机
数字3D照相机
数字监控摄像头
3D数字扫描仪

数字图像处理经典方法介绍：

图像增强技术：目的是将一幅图像中有用的信息（即感兴趣区域的信息)进行增强，同时将无用的信息(即干扰信息或噪声）进行抑制，提高图像的可观察性。
图像复原技术：目的就是把污染后的图像进行一系列的图像处理操作，去掉各类噪声，恢复原始图像的清晰视觉效果，同时也降低了后续图像处理的难度。
图像编码技术：目的就是把经过图像采集系统得到的数据进行冗余度的压缩，使得图像保持有用信息的前提下尽可能去掉冗余信息。图像压缩技术是数字图像存储和传输必不可少的技术，使得数字图像应用得到了空前的发展。
图像重建技术：目的是对非光学成像数据构建出可视化的二维/三维图像的技术。例如，在医学影像中的CT成像技术，合成孔径雷达数据构建SAR图像等。
图像分割技术：目的是使得图像中有意义的目标或者区域被分割出来，便于计算机的跟踪与识别。例如，医学上肿瘤病灶图像的分割。
目标识别的目的是通过目标建立的特征模型字符串的比对，来识别出目标的特征属性，从而识别目标身份等信息。例如，人脸识别技术。
目标编辑技术：目的是快速便捷修改图像内容，可以弥补拍摄时的操作失误，或者后期制作时增加文字标注和广告LOGO等操作;而可以用来提升图像的分辨率和面率等操作。例如，广告植入操作。
动作行为识别技术：目的是通过分析图像内人物动作和行为的属性来分类异常动作或者异常行为。此类技术往往需要多维度的判断，场景识别，人物识别，动作识别等综合分析。例如，打架、四散奔逃行为。

数字图像处理技术的贡献：

数字图像处理的来源对象是客观世界在数字世界的2维或3维投影，满足人眼观察需要;
数字图像需要经过若干预处理得到强化的可视图像或者突出有用特征的图像;
数字图像经过图像分析可以得到有用信息的数据集合即特征模型，最终得到符号抽象的语义信息;
从数字图像处理过程中得到的无论是数据特征，还是抽象的符号语义，都可以供计算机模式识别、推理和决策使用;同样也可以满足人类对数字图像的快速检索和理解。
计算机可以根据数学公式或者数据驱动生成计算机图像，俗称Computer Graphics技术。此类技术可以用于AR/VR、数字孪生、元宇宙等应用。

1.3.4数字图像处理的应用场景

数字图像已经深入到人类生活中的方方面面;
数字图像处理满足人们对工作、学习、生活的需求必不可少的辅助工具;
从计算机办公学习软件、课堂教学采用电子教材、手机的各类应用、新闻娱乐视频服务、数字媒体编辑工具、国家农林牧副渔产业链、航天卫星遥感、深空探索、深海探索、军事国防领域、智慧城市、智慧医疗、智慧金融等等，无处不在。

课堂讨论：

数字图象处理技术的意义?
数字图象处理技术的分类?
数字图象处理对人类社会的贡献。
谈一谈数字图象处理与人工智能融合的应用。

课件：

1.4深度学习在数字图像处理中的应用

1.4.1深度学习在数字图像处理中的意义

数字图像处理技术在我们日常生活中起到了必不可少的作用。但是由于传统技术存在着理论、技术及工程实现的瓶颈，在自动化处理方面的效率较低，在内容理解和自主决策上与人类存在着较大偏差，无法满足实际应用中对系统效率、准确性和实时性等应用需求。
深度学习技术是传统神经网络技术的衍生和拓展而来的技术。深度学习技术来实现复杂的训练和自动快速检测，且检测平均准确率明显优于大多数传统特征模型的检测方法。其特点是深度学习训练时需要较长时间的训练和调参过程，但训练好模型在检测识别领域，具有良好的高效、实时性和泛化性。
其特点依靠深度学习结构+计算机算力+标注样本数据驱动。
但是深度学习技术目前仍然处在发展的初级阶段。尽管在一些应用领域取得了不错的效果，并不能完全取代传统的图像处理方法，而是视为传统图像处理方法的补充方案。
主要原因在于:对海量标注样本的依赖性;模型参数安全脆弱性;训练阶段对计算资源需求较大;模型泛化能力有待提高等问题。

1.4.2深度学习与机器视觉的深度融合

深度学习技术中深度神经网络的模型搭建、模型训练、模型调参是最基础的构成。目前已经在下面领域取得了成功应用：
图像/视频智能编解码、超分辨率提升、图像自动修复等;
图像/视频目标精细化分割、百万目标分类、目标识别等;
图像/视频目标重识别与跟踪、语义标签自动标注、图像问答系统、图像检索、语义分割等领域。

1.4.3深度学习技术的概念和特点

深度学习的概念：

深度学习是机器学习研究中的一个分支领域，其动机在于建立、模拟大脑进行分析学习的神经网络，它模仿大脑的机制来解释数据，例如图像，声音和文本。深度学习是无监督学习的一种。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

深度学习的特点：

深度学习是学习样本数据的内在规律和表示层次。这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。
深度学习在图像搜索技术，数据挖掘，自主学习，机器翻译，语义处理，智能决策，自动推荐和自动问答技术，以及其他相关领域都取得了丰硕成果。
深度学习使机器模仿视、听、触、嗅和思考等人类的活动，解决了很多传统的、复杂的模式识别难题，使得人工智能应用得到了飞速发展。