1-写在前面
怎么说呢,这个内容已经有不少师兄师姐做过了,做的也是非常的优秀。这篇文章开始与2023年12月1日,也不知道我能不能坚持更新下去。主要是自己用来复习,也许里面还有很多我理解不对的地方,希望各位在评论中批评指正。对数字图像分析这门课,个人感觉内容比较多且杂,作为一个不是电子信息学院的同学,一直会有这样的感觉:就是讲理论的时候:“好难懂,为什么不配合实践让我们加深理解呢?”到了留作业实践的时候:“vocal,这又是什么东西,我的代码为什么处理出来这么奇怪...根本不知道为什么论文作者这么写代码,其中原理是什么...”就是感觉会很矛盾。
本人本科是工科生,数理基础可能也不是太好,如果后续博文出现问题,希望大家及时指出!!感谢!
关于课程的一些信息:
[提供课程主页,可以下载课程Ppt,每个学期都会删除上个学期的重新更新]
课程主页:数字图像分析课程主页
2-图像数字化
[更新时间:2023年12月01日]
采样与量化;邻域;连接(连通悖论);距离;图像采集效率;数字弦、数字弧、紧致弦。
本章(我认为)重点:
采样与量化
需要知道存储一个水平尺寸为M,垂直尺寸为N,灰度级为G的图像需要多少bit(计算过程如下图所示);
邻域[4-邻域、对角邻域、8-邻域]
如下图所示,注意要有印象:4-邻域(N4)、对角邻域(ND)、8-邻域(N8)。
连接[4-连接、8-连接、混合链接]、连接悖论!
[这块可能理解的不是很好,请注意甄别!]
像素之间的关系有邻接、连接和连通。
三种连接方式:4-连接、8-连接、混合链接(m-连接)[如下图所示]
[我存在一个问题]:由上图我们可以看到4-连接条件最为苛刻;8-连接最为宽松;我理解是:4-连接一定是8-连接;m-连接也一定是8-连接。所以我在表述两个像素之间关系的时候就会比较纠结用什么来表述,存在一定的歧义。
然后课件中表述:混合链接(m-连接)是为了消除8-连接可能产生的歧义性,那我是不是可以理解我们表述连接的时候尽量采用条件更为苛刻的连接来表述?
连通悖论
什么是连通悖论?
就是轮廓和内部点均采用8连通或者4连通是会存在连通上的歧义。[书本上的定义]
如何解决连通悖论产生的问题?
轮廓与内部采用不同的连通方式,内部采用4连通,轮廓采用8连通或者轮廓采用4连通,内部采用8连通。
[我存在的问题]:我不知道我对连通悖论理解的是否正确。[如下图所示]
如图1,如果内外都是8连通,则内部与外部是连通的;如果都是4连通,则内部与外部不连通,轮廓也不连通,也是不对的。[这是否就是连通悖论呢?]
距离[欧氏距离、城区距离、棋盘距离]
重点在对于城区距离和棋盘距离的理解。计算方法如下图所示,配合图像很好记忆。
留下印象:城区距离D4;棋盘距离D8。类比4-邻域和8-邻域。
图像采集效率
图像采集网格有三种:正方形、三角形和六边形。
采样效率定义为:单位圆面积与覆盖该单位圆的网格面积之比。
数字弦、数字弧
1、什么是数字弧?
2、如何判断一个数字弧是不是数字弦?
数字弦的定义:
数字弧:
反例:[如何判断一个数字弧是不是数字弦]
3、数字弦、紧致弦定义?
[我存在问题的地方]:如下图,我不理解什么叫8-数字直线段。难道是因为它由8段组成吗?然后讲这个平移这里我所理解的意思:是不是想告诉我们用数字弦来表述这样的一个直线段是在平移的情况下结果是有限的不会因为平移造成特别多的结果?
本章总结
1、采样 需要知道存储一个水平像素M数值像素N灰度值k的图像需要多少bit;
2、知道什么是4-邻域、对角邻域、8-邻域;
3、会判断4-连接、8-连接、m连接(混合连接)尤其:连通悖论!
4、距离:欧氏距离、城区距离、棋盘距离;
5、网格采集效率(正方形网格、三角形网格、六边形网格)
6、数字弦、数字弧(判断一个数字弧是不是数字弦?)紧致弦(注重一下数字弦和紧致弦的定义!)
[最后]如果有总结遗漏的地方,欢迎私信通知我!
3-图像变换
[更新时间:2023-12-08]
可分离和正交图像变换、离散傅里叶变换(DFT)、离散余弦变换(DCT)、KL变换(KLT)
可分离和正交图像变换
可分离图像变换:一个2-D的图像变换等效为两个1-D的图像变换。
离散傅里叶变换(DFT)
我觉得这篇博文写的比较详细,大家可以去参考。我们需要知道傅里叶表达式是怎么样的,傅里叶变换的性质。
这篇文章里讲了不少傅里叶的物理性质,包括图像变换完如何解读傅里叶图像,但是我还是有点云里雾里的。
二维离散傅里叶变换表达式:
二维离散傅里叶变换的性质:线性、比例、平移、卷积、旋转。
[我不理解的地方]:就是傅里叶处理完图像怎么分析,傅里叶变换的具体含义之类的...我目前的理解就是图像可以通过傅里叶变换从空间域变换到频域,不同的噪声在频域上有各自的特点,比如说一个正弦噪声在频域上可能就是一个亮点,我们可以通过滤波等操作很轻松的讲噪声去除。但是整个傅里叶变换对于我还是个科技黑箱,就是变换完的图片我是真的看不懂啥意思,也就是粗浅的知道哪里是高频哪里是低频罢了。
KL变换(Karhunen-Loeve变换)
了解KL变换的基本步骤。
[这块纯纯完全不懂,等我后续再研究一下]我目前的理解是他是一个特征提取的算法,就是可以把一张图片的特征提取出来,大概是这个作用,但是其中的原理什么的没有看懂。
本章总结
1、了解图像变换的基本方法,并将中文和英文缩写相对应。
离散傅里叶变换(DFT)、离散余弦变换(DCT)、Karhunen-Loeve变换(KLT)
2、离散傅里叶变换表达式及基本性质
3、KL变换的基本步骤
[最后]如果有总结遗漏的地方,欢迎私信通知我!以及如果本文有任何表述错误欢迎下方留言讨论,我将及时修正。