形象理解二维傅里叶变换

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达1575737631c1494322378808a450ba75.jpeg

来自 | 知乎  作者 | 阿姆斯特朗

链接 | https://zhuanlan.zhihu.com/p/110026009

编辑 | 深度学习这件小事公众号

本文仅作学术交流,如有侵权,请联系后台删除

   1.回顾一下一维FT

公式: outside_default.png

通俗来讲,一维傅里叶变换是将一个一维的信号分解成若干个复指数波 outside_default.png 。而由于 outside_default.png ,所以可以将每一个复指数波 outside_default.png都视为是余弦波+j*正弦波的组合。

对于一个正弦波而言,需要三个参数来确定它:频率 outside_default.png ,幅度 outside_default.png ,相位 outside_default.png 。因此在频域中,一维坐标代表频率,而每个坐标对应的函数值也就是 outside_default.png 是一个复数,其中它的幅度 outside_default.png 就是这个频率正弦波的幅度 outside_default.png ,相位 outside_default.png 就是 outside_default.png 。下图右侧展现的只是幅度图,在信号处理中用到更多的也是幅度图。

c6b3e234ae38888bf35addacd1a8e7f1.jpeg

一维傅里叶变换就是一个基变换,在时域中,基是一族冲激信号 outside_default.png ,在频域中;基是 outside_default.png ,而且这组基是正交基。

0d197a978d41e6193dd98f0d83472f40.jpeg

F=Mf,基变换示意图


   2.类比:从一维到二维

一维信号是一个序列,FT将其分解成若干个一维的简单函数之和。二维的信号可以说是一个图像,类比一维,那二维FT是不是将一个图像分解成若干个简单的图像呢?

确实是这样,二维FT将一个图像分解成若干个复平面波 outside_default.png 之和。如下图:

cc5a69954a396cf645db107ab571dbab.jpeg

二维FT的公式: outside_default.png

通过公式,我们可以计算出,每个平面波在图像中成分是多少。从公式也可以看到,二维傅里叶变换就是将图像与每个不同频率的不同方向的复平面波做内积(先点乘在求和),也就是一个求在基 outside_default.png 上的投影的过程。(应该知道 outside_default.png 是b在a上的投影,只不过这里的|a|的值被设为1,所以只有内积)


   3.什么是二维频率域K-SPACE

对于正弦平面波,可以这样理解,在一个方向上存在一个正弦函数,在法线方向上将其拉伸。前面说过三个参数可以确定一个一维的正弦波。哪几个参数可以确定一个二维的正弦平面波呢?答案是四个,其中三个和一维的情况一样(频率 outside_default.png ,幅度 outside_default.png ,相位 outside_default.png),但是具有相同这些参数的平面波却可以有不同的方向 outside_default.png 。如下图所示:

5d364370e57b3247daefdc4f4828668c.jpeg

两个不同方向的平面波叠加

类比一维中,幅度和相位可以用一个复数表示,它可以作为我们存储的内容。但是还有两个:一个频率一个方向。这时想到向量是有方向的,也是有长度的。所以我们用一个二维的矩阵的来保存分解之后得到的信息。这个矩阵就是K空间。(一般用k来表示空间频率,单位是1/m)

什么意思呢?就是说一个二维矩阵点 outside_default.png 代表这个平面波的法向量outside_default.png,这个向量的模 outside_default.png 代表这个平面波的频率 outside_default.png ,这个点里面保存的内容复数就是此平面波的幅度和相位。下面这个图很好的体现了这一点:

9b9a3d0ba92450aad45fb0f097d69120.jpeg

也因此K空间的中心对于低频,周围对于高频。如下图,K空间中只有(0,0)处有值,也就是信号都是直流即不存在变化,所以实空间就是一张白纸。

d808051ba970c196228dacc7225b5443.jpeg

再如下面这个图片,中心低频贡献了图像的主体,周围高频提供图像的细节和边缘。

55de003f7c03aac01fcb34de0677d4f6.jpeg

因此,k空间的每一个位置存储的数代表了所在位置复平面波在图像中占多少成分,我们就可以用每个系数*所代表的平面波相加得到原来的图像,也就是下图。所以k空间和对应图像储存的信息含量是一样的,只不过表现形式不同,或者说基不同。

a6f7f1303e15fc302f4ce658ec597786.jpeg

   4.K空间的一些性质

离散的2D-FT

在数字图像中,数据都是离散的。也就涉及到采样的问题,和一维一样,如果采样率过低,k空间就会混叠。同时在k空间中采样过低,图像也会混叠。

FOV和分辨率在k空间和图像中是相反的关系。也就是:

outside_default.png outside_default.png

244302f23273079438f9c7e3daf63e1f.jpeg eea9f04d849f57f960e32ea02fe9b299.jpeg

减小kmax,使得图像分辨率下降,减小Δk,使得FOV缩小。

旋转不变性

从平面波的角度很容易理解,旋转没有改变平面波的幅度相位,只是将所有的平面波都旋转了一个角度。下面这个图像显示了二维傅里叶变换中,实空间旋转多少,频率空间也会相应旋转多少。这其实是高维傅里叶变换缩放定理的一种特殊情况。(连续的是可以证明的,离散的涉及插值 ,不一定完全准确)

cb169bd263df6f3adaca73b45910561b.jpeg


   5.其他

1.因为matlab中的fft算法都是将0放在第一个的,所有写matlab时一定要将k空间fftshift一下使得零频回到k空间中心。

2.简单的应用k空间进行去噪例子。通过去掉明显的k空间的异常峰,可以去除图像中有规律变化的噪声或者伪影。

81bc3892e49ce3548188bf18e127af7f.jpeg

指纹去噪

2faf01dd5825b3abf1246d00cd9e0ef6.jpeg

天体表面去噪


   6、评论及解答

1、始终想不通为啥各个波的叠加能反应出某一个像素点的信号大小

你把它理解向量分解就懂了,平面波就是基,k空间里的数就是基的系数。你得到系数(k空间)的时候就是在投影,变为原向量(图像)就是叠加。只不过这里一个图像是一个向量而已。复平面波叠加时,先经过放大(幅度)在经过移位(相位),相位信息里保留了很多位置信息,可以查看我的另一个回答:

为什么用图像二维傅里叶变换的相位谱进行反变换,能够大致得到原图的形状,而幅度谱则不行呢?

https://www.zhihu.com/question/23718291/answer/1057562032

2、傅里叶变换后图像是关于频率矩形中心对称的,那么对称的4个平面三角波不就是注定了幅值和相角,频率是相等的。那么这样不是说明了任何波都是包含了4个这样对称的三角波,由它们组成?

是中心共轭对称,而没有左右上下的对称。而且只有实数图像的k空间才有这种特点,这是为了将复平面波中的虚部抵消掉,只留下实数部分。复数图像的k空间没有共轭对称的特点。下面是k空间的一部分数据,中心点为(101,101)。

e2902dd2f4b9cd3b8889b40838818623.jpeg


参考:

[1] http://mriquestions.com

[2] A. Zisserman's lecture in B14 Image Analysis

链接:http://www.robots.ox.ac.uk/~az/lectures/ia/lect2.pdf

(这个slides真的不错,大家可以下载看看,里面也有其他的内容)

好消息!

小白学视觉知识星球

开始面向外开放啦👇👇👇

 
 

1b068760e72fd27e7acb547443091d51.jpeg

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值