学习数字图像处理经验谈

一、面向应用:层层分解、抓住要点

我们学习数字图像处理的最终目的还是应用,不管是用它来研制产品还是研发项目抑或是研究课题,都要用数字图像处理的理论、方法和技术来解决实际问题。在此过程中,提高效率是非常重要的,因此,我们在实际应用过程中要面向需求,结合实际;将问题层层分解,理清解决思路;抓住其要害,集中力量进行突破,切忌眉毛胡子一把抓。

下面就结合笔者所研究过的一个课题进行详细说明。

任务要求:一台智能移动机器人上配备有单目可见光视觉传感器,要求通过该视觉传感器采集的视频序列图像,实现在复杂环境下实现对纹理清晰的特定目标的实时跟踪。

注:该问题的解决应从硬件和软件两个方面进行考虑,对硬件的选择、设计和搭建超出了本文所讨论的内容,因此,本文仅从数字图像处理方法的角度进行分析)

分析讨论:

(1)任务分解:通过对任务要求进行分析可知,该任务的核心是“目标识别跟踪”;在此基础上有两个约束条件:“复杂环境下”和“实时性”;方法实现的平台是“移动机器人”。任务的核心——“目标识别跟踪”是我们所需要解决的难点和重点;约束条件1“复杂环境下”则要求我们对所采集的图像进行去噪预处理;约束条件2“实时性”也是需要解决的问题,这就要求我们尽可能地降低各种算法的运算复杂度;由于实现平台“移动机器人”在行进过程中采集的视频图像存在抖动现象,因此,在对采集的图像进行去噪后需要对其进行增稳处理。通过初步分解,我们就得到了任务中所要解决的问题以及大致流程(如图1所示)。

  

图1  任务分解及流程

(2)难点分解:本任务的难点是“目标识别跟踪”。之所以称其为难点,是对目标的识别和跟踪过程中,存在视觉传感器与目标物体的相对运动,因而,目标在图像中存在着尺度变化、旋转变化、视角变化、照度变化以及局部遮挡,这给目标识别和跟踪带来了挑战。我们常用的目标识别与跟踪算法有:基于帧间差分的目标识别与跟踪法、基于光流的目标识别与跟踪法、基于模板匹配的目标识别与跟踪法、基于颜色的目标识别与跟踪法、基于特征点的目标识别与跟踪法。考虑到每种方法的特点以及待跟踪目标具有清晰的纹理,我们可以采用基于特征点的目标识别与跟踪法,更进一步地说,我们应采用尺度不变特征点(SIFT)作为识别与跟踪的特征,因为尺度不变特征点对尺度变化、旋转变换、视角变化、照度变化和局部遮挡具有鲁棒性。同时,我们希望目标识别和跟踪算法具有良好的实时性,因而,可以考虑PCA-SIFT和SURF特征点作为目标特征。此外,由于视频序列相邻图像之间存在相关性,目标在相邻帧之间不会有剧烈的变换,因而,可采用隔帧搜索法对目标进行检测并用Kalman滤波或粒子滤波对目标的轨迹进行预测。难点分解的过程如图2所示。

 

图2  难点分解过程

(3)算法分解:经过任务分解和难点分解后,我们已经对任务的实现步骤和每个步骤所需的算法有了一个清晰的了解。在此之后,我们还需对每一个具体的算法进行分解,形成实现步骤,以便于后续的研究以及模块化分工实现。

 

二、面向学习:追根溯源、比较总结

在数字图像处理中,很多算法是一脉相承或有着密切联系的,搞清楚这些来龙去脉以及相互联系,有利于我们加强对算法的理解以及改进创新。

那么,如何把握这些联系呢?我认为,首先得清楚每种算法的提出背景,也就是“这种算法为什么会被提出”或是“这种算法是针对什么问题而提出的”。就拿数字图像变换中的内容为例,我们是从图像的空间变换讲起的,但是空间变换无法反映图像的频率分布信息,随着傅里叶变换的诞生,这一问题得到了解决,傅里叶变换也被研究者誉为是“图像处理的第二种语言”。正在人们为之欢心鼓舞之时,研究者有发现傅里叶变换也存在着不足,它在空域上无任何分辨,不能作局部分析。针对于此,D.Gabor 于1946年提出了加窗傅里叶变换,也就是著名的Gabor变换,它通过引入一个时间局部化“窗函数”改进了傅里叶变换的不足,但其窗口大小和形状都是固定的,没有从根本上弥补傅里叶变换的缺陷。小波变换的提出从根本上解决了这一难题,它有一个灵活可变的时间—频率窗,能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析,“数学显微镜”的美誉也因此得来。如果我们能够把这些联系梳理清楚,那么,我们在学习小波变换时就会豁然开朗,游刃有余。难道小波变换就那么完美吗?答案当然是否定的,当前有很多算法就如何提高小波变换的效能提出了改进。按照上述的“联系”方式,就不难建立起完备的知识体系。

 

图3  图像分析联系示意图

谈过了“追根溯源”,我们再来聊聊“比较总结”。我们以图像的边缘检测为例来进行说明。每一种方法都能实现边缘检测,但对于同一幅图像,每一种边缘检测方法的效果又不尽相同。这是为什么呢?原来,每一种边缘检测的方法都有自己优点和不足,都有自己特定的应用背景。我们不妨对其进行列表比较(如表1所示)。

表1  边缘检测算子比较

名  称

特    点

基于一阶微分算子检测边缘

运算简单,但对噪声敏感

基于LOG算子检测边缘

边缘保留较为完整、定位准确、抗干扰能力强

基于 Canny算子检测边缘

抗干扰能力强,边缘连续性好

基于SUSAN算子检测边缘

抗噪声能力好、运算量小,速度快

对各种边缘检测算子进行比较后,它们各自的特点便一目了然,在何种情况下运用哪种边缘检测算子效果最佳便做到了心中有数。

在比较完各种边缘检测算子的“个性”之后,我们不妨再来总结一下它们的“共性”。尽管边缘检测的方法林林总总,但各种方法的共同目的就是要检测出图像灰度变化剧烈的区域。从数学的角度来看,就是对数字图像进行差分;从信号处理角度看,就是用高通滤波器来保留高频信号。

学习的过程讲究循序渐进,温故知新,当然,对数字图像处理技术的学习也不例外。但是,数字图像处理技术又有自身的特点:理论深、角度广、更新快,因此,良好的学习方法可以使数字图像处理的学习事半功倍。在学习数字图像处理技术时,读者不妨尝试着去追根溯源、比较总结,相信定会受益匪浅。

本文转自:http://xiaozu.renren.com/xiaozu/252226/335693784

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《学以致用:深入浅出数字信号处理--江志宏》这本书是一本非常好的学习数字信号处理的入门读物。本书结合实际案例,以深入浅出的方式,通过讲解数字信号的基本概念和原理,让读者了解数字信号处理的基本知识和应用。 本书主要包括以下几个方面的内容:数字信号的基本概念、数字信号的离散化、数字滤波器、数字信号处理系统的设计与实现、数字信号的快速傅里叶变换、数字信号的小波变换、数字信号处理的应用等。其中,数字滤波器是数字信号处理中最为重要的一部分,本书详细介绍了各种数字滤波器的原理以及实现方法。 本书的优点在于,对于数字信号处理的基本概念和原理进行了系统而全面的讲解,内容涉及广泛,案例丰富,实用性强,读者容易掌握。此外,作者在讲解过程中,一些难点问题进行了详细的解答和举例说明,使读者能够更加深入地理解数字信号处理。同时,本书还提供了大量的练习题和实践项目,读者可以通过实践来加深对数字信号处理的理解。 总之,本书是一本非常适合初学者阅读的数字信号处理入门读物,它不仅能够帮助读者掌握数字信号处理的基本原理,而且还能够应用数字信号处理的知识,解决实际问题,让学习达到事半功倍的效果。 ### 回答2: 《学以致用:深入浅出数字信号处理》是由江志宏著作的一本非常好的数字信号处理入门教材。这本书主要针对学习数字信号处理的人,介绍了这个领域的基础知识和应用技术。书中采用深入浅出的方法逐步讲解了数字信号的基本概念、傅里叶变换、滤波器设计以及数字信号处理中常用的算法和技术。同时,该书还提供了大量的实例和练习题,以帮助读者加深对知识的理解。 在这本书中,作者尤其关注将理论知识与实际应用相结合。他注重讲解数字信号处理在实际问题中的应用,具有很高的实用性,能够引导读者进行实际操作与应用。他还介绍了一些常用的数字信号处理软件及其应用,如MATLAB等,让读者得以更好地了解其应用方法。 此外,该书还介绍了数字信号处理在许多领域中的实际应用,如音频处理、图像处理、通信系统等,让读者了解到数字信号处理在现代科技中扮演的角色。 总的来说,该书内容丰富、实用性强,适合于数字信号处理领域的初学者。通过学习本书,读者能够深入了解数字信号处理的理论知识和技术应用,掌握数字信号处理的基本方法与技能,更好地应用数字信号处理技术解决实际问题,并为相关领域做出贡献。 ### 回答3: 江志宏的《深入浅出数字信号处理》一书以浅显易懂的方式介绍了数字信号处理的基础知识、技术和应用。书中将数字信号处理理论和数学分析与实际应用结合起来,强调“学以致用”的原则。 通过本书的学习,读者可以了解信号的基本性质、采样定理、离散傅立叶变换、数字滤波器等基本概念和方法。此外,书中还介绍了实时数字信号处理的算法和应用,包括语音信号处理、音视频的编解码、数字滤波器的设计和应用等实际问题的解决方案。 作者通过生动的案例和实际应用场景,使得读者更容易理解数字信号处理这一复杂领域的基本知识和应用。此外,书中还提供了大量的编程示例和实例代码,使得读者可以更好地理解和应用所学知识,提升编程技能。 总之,江志宏的《深入浅出数字信号处理》一书非常适合数字信号处理领域的初学者和从业者,特别是工程师和技术人员。它不仅有深入浅出的风格,还注重实际应用,能够帮助读者更好地理解数字信号处理的基本知识和应用,提升技能水平。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值