压缩感知与磁共振成像

01 压缩感知原理和建模

传统的数据采样和重构需要遵循Nyquist采样定律,即采样频率必须大于信号频率带宽的2倍,才能完整的重建信号。如果采样频率低于2倍的频率带宽,信号在频域频谱搬移后就会发生混叠,产生伪影。

压缩感知(Compressed Sensing)理论提出:如果一个信号是稀疏的,或者在其某个变换域是稀疏的,那么信号可以从远低于Nyquist采样定律的采样频率中重建出来,即稀疏或可压缩信号从其投影到某个子空间的少量值上通过非线性重建。

假设一个信号 x ∈ R N × 1 x\in R^{N×1} xRN×1,存在正交变换 Ψ ∈ R N × N \Psi\in R^{N×N} ΨRN×N,在此变换域中 x x x的稀疏表示 s ∈ R N × 1 s\in R^{N×1} sRN×1 K K K稀疏的,那么可以通过一个观测矩阵 Φ ∈ R M × N \Phi\in R^{M×N} ΦRM×N,产生一个观测向量 y ∈ R M × 1 y \in R^{M×1} yRM×1,满足 K < M ≪ N K<M\ll N K<MN y y y即采样值(已知)。压缩感知问题就是在已知测量值 y y y和测量矩阵 Φ \Phi Φ的基础上,求解欠定方程组 y = Φ Ψ s y=\Phi \Psi s y=ΦΨs得到原信号 x x x x = Ψ s x=\Psi s x=Ψs

可以将该问题建模成一个优化问题,在数据保真项的约束下,通过控制 s s s的稀疏程度(实际应用中更通常使用 l 1 l_1 l1范数),求解以下反问题,可以从少量的信号采样中,得到最终的信号重建结果:
m i n s ∣ ∣ s ∣ ∣ l 0 ,   s . t . Φ Ψ s = y \underset{s}{min} ||s||_{l_0},\ s.t. \Phi \Psi s=y smin∣∣sl0, s.t.ΦΨs=y
想要通过CS理论重构出精确的原始信号,需要满足以下三个要求[2]:

①信号的稀疏性:待重建信号需要在某一个变换域(包括恒等变换)是稀疏的,即可压缩的;

②非相关性/等距约束性:非相关性要求欠采样造成的伪影和信号在稀疏表示下是不相关(noise-like)的,这样可以通过非线性算法从带有混叠伪影的信号中重构出原始信号。这一条件约束的是测量矩阵 Φ \Phi Φ,要求观测矩阵满足有限等距性质(RIP),RIP的等价条件是观测矩阵和稀疏表示基不相关(incoherent)。独立同分布的高斯随机矩阵、随机部分傅里叶矩阵都可以作为普适的测量矩阵;

③非线性重构算法:从 M M M维测量向量 y y y重构长度为 N ( M ≪ N ) N(M\ll N) N(MN)的原始信号 x x x是一个NP-hard问题,无法直接求得最优解,只能通过高度非线性的最优化算法求得其次最优解。

02 压缩感知在MRI上的应用

MR图像的变换稀疏性和MR采集的编码性质是使CS在MRI中实现的两个关键特性。

磁共振成像由于其K空间采样和磁共振图像的稀疏性,以及临床上快速成像的要求,非常适合压缩感知的应用。

大部分的磁共振图像是稀疏的(如血管造影)或者在特定的变换域如小波变换、有限差分变换下具有很好的稀疏表示。自然的满足了压缩感知的第一条要求, 稀疏性是利用压缩感知重建磁共振图像的基础 。

MRI在K空间即频率空间采集数据,再通过反傅里叶变换得到空间域坐标值,傅里叶变换矩阵作为观测矩阵可以增加非相干性,前一小节中提到随机部分傅里叶矩阵满足等距约束性,可以作为观测矩阵产生不相干伪影。然而囿于磁共振采集硬件和人体生理上的限制,采样轨迹必须是相对平滑的直线或曲线,完全的随机采样是无法实现的。如何设计合理的欠采样方案,使得重建出的图像在稀疏域上的混叠伪影尽可能少,是快速磁共振成像的一个关键问题。

除此之外,MR图像在k空间中的能量分布并不是均匀的,MR I中的大部分能量集中在靠近 k-space 的中心,并向四周衰减,因此欠采样方案的设计应该具有可变密度,在k空间中心附近采样更加密集,同时采样轨迹要尽可能的不规则(随机)以满足观测矩阵的不相干性要求,满足以上条件的欠采样越快越好。

此时压缩感知模型中的观测矩阵 Φ \Phi Φ对应于部分傅里叶变换矩阵 F u = P F F_u=PF Fu=PF,其中 P P P是采样矩阵(对应于我们常说的mask),由0和1组成, F F F是傅里叶变换矩阵,图中给出了一些欠采样方案例子。

满足稀疏性和非相干性要求的MRI重建过程可以建模成以下优化问题:
m i n x ∣ ∣ Ψ x ∣ ∣ 1 ,   s . t . ∣ ∣ A x − y ∣ ∣ 2 < ϵ \underset{x}{min} ||\Psi x||_1, \ s.t. ||Ax-y||_2<\epsilon xmin∣∣Ψx1, s.t.∣∣Axy2<ϵ
其中 A A A为感知(观测)矩阵,单通道数据情况下 A = P F A=PF A=PF,多通道数据情况下 A = S P F A=SPF A=SPF S S S是线圈敏感度矩阵,用来合并和恢复多通道数据。

有时还会加入全变分(TV)算子作为一个惩罚项,TV被定义为图像中绝对变化的总和,目标函数变为:
m i n x ∣ ∣ Ψ x ∣ ∣ 1 + α T V ( x ) ,   s . t . ∣ ∣ A x − y ∣ ∣ 2 < ϵ \underset{x}{min} ||\Psi x||_1+\alpha TV(x), \ s.t. ||Ax-y||_2<\epsilon xmin∣∣Ψx1+αTV(x), s.t.∣∣Axy2<ϵ
其中 α \alpha α是参数,用于权衡稀疏性约束和TV约束。

03 非线性重建算法

上述优化问题可以转化成拉格朗日形式:
a r g m i n x   λ ∣ ∣ Ψ x ∣ ∣ 1 + ∣ ∣ A x − y ∣ ∣ 2 2 \underset{x}{argmin}\ \lambda||\Psi x||_1+||Ax-y||_2^2 xargmin λ∣∣Ψx1+∣∣Axy22
或者加入TV算子:
a r g m i n x   λ ∣ ∣ Ψ x ∣ ∣ 1 + α T V ( x ) + ∣ ∣ A x − y ∣ ∣ 2 2 \underset{x}{argmin} \ \lambda ||\Psi x||_1+\alpha TV(x)+||Ax-y||_2^2 xargmin λ∣∣Ψx1+αTV(x)+∣∣Axy22
其中 α \alpha α λ \lambda λ都是参数

解决该优化问题的主要难度来自于 l 1 l_1 l1范数和变分算子等正则项的不可微性,导致无法直接通过线性最小二乘算法求解,转而寻求更多的非线性迭代算法。下面简单介绍几种常见的非线性算法:

①非线性共轭梯度法

Lustig等人[1]将小波变换作为稀疏变换应用于CS-MRI,建立如下图像重建模型,并采用非线性共轭梯度下降算法和回溯线搜索进行求解:
x = a r g m i n m   1 2 ∣ ∣ F u m − y ∣ ∣ 2 2 + λ ∣ ∣ Ψ m ∣ ∣ 1 x= \underset{m}{argmin}\ \frac{1}{2} ||F_um-y||_2^2+\lambda||\Psi m||_1 x=margmin 21∣∣Fumy22+λ∣∣Ψm1
非线性共轭梯度法将线性共轭梯度(CG)法扩展到非线性求解问题,用CG的方式计算优化方向,然后用回溯线搜索算法计算一个可接受的步长,用梯度 Δ f k \Delta f_k Δfk替代残差 g k g_k gk

对于非线性共轭梯度法的关键在于如何去计算梯度 Δ f ( m ) \Delta f(m) Δf(m),由于 l 1 l_1 l1范数是绝对值的和,并不是一个光滑可微的函数(这也是求解该优化问题的难点),Lustig等人用一个平滑函数$x\approx\sqrt{x*x+\mu } 来近似绝对值函数,这样就可以求得拉格朗日函数 来近似绝对值函数,这样就可以求得拉格朗日函数 来近似绝对值函数,这样就可以求得拉格朗日函数f(m)$的近似梯度:
Δ f ( m ) ≈ F u ∗ ( F u m − y ) + λ Ψ ∗ W − 1 Ψ m \Delta f(m) \approx F_u*(F_um-y)+\lambda \Psi * W^{-1} \Psi m Δf(m)Fu(Fumy)+λΨW1Ψm
其中 W W W是对角矩阵,对角元素 w i = ( Ψ m ) i ∗ ( Ψ m ) i + μ w_i=\sqrt{(\Psi m)_i * (\Psi m)_i+\mu} wi=(Ψm)i(Ψm)i+μ

算法流程:

在这里插入图片描述

②迭代软阈值算法(Iterative Shrinkage Thresholding Algorithm,ISTA)

在凸优化问题中,对于可微分的目标函数,可以通过梯度下降法(gradient descent)迭代求得最优解;对于不可微分的目标函数,引入次梯度(subgradient)也可以求解,但速度比较缓慢。为此,针对一些整体不可微分,但却可以分解的目标函数,引入近端梯度法(Proximal Gradient Descent),用来解决包含不可导项的优化问题。

对于一个目标函数可以分解成如下形式的:
m i n   f ( x ) = m i n { g ( x ) + h ( x ) } min\ f(x)=min\{g(x)+h(x)\} min f(x)=min{g(x)+h(x)}
其中, g ( x ) g(x) g(x)是凸函数且可以微分, h ( x ) h(x) h(x)也是凸函数但可能不可微分,仍然可以用平滑部分 g g g的二次近似来定义向最优解下降的一步。

定义近端函数 p r o x prox prox p r o x h , t ( x ) = a r g m i n z   1 2 t ∣ ∣ x − z ∣ ∣ 2 2 + h ( z ) prox_{h,t}(x)=\underset{z}{argmin}\ \frac{1}{2t}||x-z||_2^2+h(z) proxh,t(x)=zargmin 2t1∣∣xz22+h(z)
x ∗ = a r g m i n z   g ( z ) + h ( z ) ≈ a r g m i n z   g ( x ) + ▽ g ( x ) T ( z − x ) + 1 2 t ∣ ∣ z − x ∣ ∣ 2 2 + h ( z ) x ∗ = a r g m i n z   [ 1 2 t ∣ ∣ z − ( x − t ▽ g ( x ) ) ∣ ∣ 2 2 + h ( z ) ] = p r o x h , t ( x − t ▽ g ( x ) ) x^* = \underset{z}{argmin}\ g(z)+h(z) \approx \underset{z}{argmin}\ g(x)+\bigtriangledown g(x)^T(z-x)+\frac{1}{2t}||z-x||_2^2+h(z) \\ x^*= \underset{z}{argmin}\ [\frac{1}{2t}||z-(x-t\bigtriangledown g(x))||_2^2+h(z)]=prox_{h,t}(x-t\bigtriangledown g(x)) x=zargmin g(z)+h(z)zargmin g(x)+g(x)T(zx)+2t1∣∣zx22+h(z)x=zargmin [2t1∣∣z(xtg(x))22+h(z)]=proxh,t(xtg(x))

迭代软阈值算子为近端算子的一种形式,当 h ( x ) h(x) h(x) l 1 l_1 l1范数的形式时:

p r o x t ( x ) = a r g m i n z   1 2 t ∣ ∣ x − z ∣ ∣ 2 2 + ∣ ∣ z ∣ ∣ 1 = a r g m i n z   ∣ ∣ x − z ∣ ∣ 2 2 + 2 t ∣ ∣ z ∣ ∣ 1 = S t ( x ) prox_t(x)=\underset{z}{argmin}\ \frac{1}{2t}||x-z||_2^2+||z||_1=\underset{z}{argmin}\ ||x-z||_2^2+2t||z||_1=S_t(x) proxt(x)=zargmin 2t1∣∣xz22+∣∣z1=zargmin ∣∣xz22+2t∣∣z1=St(x)

S t ( x ) S_t(x) St(x)为软阈值算子,

在这里插入图片描述

Ricardo Otazo等人[4]用L+S分解模型求解动态磁共振成像问题时用到了迭代软阈值方法,L+S模型为:
m i n L , S   1 2 ∣ ∣ E ( L + S ) − d ∣ ∣ 2 2 + λ L ∣ ∣ L ∣ ∣ ∗ + λ S ∣ ∣ T S ∣ ∣ 1 \underset{L,S}{min}\ \frac{1}{2}||E(L+S)-d||_2^2+\lambda_L||L||_*+\lambda_S||TS||_1 L,Smin 21∣∣E(L+S)d22+λL∣∣L+λS∣∣TS1
λ L \lambda_L λL λ S \lambda_S λS是参数,用来权衡数据一致性与核范数和 l 1 l_1 l1范数之间的关系。

在迭代求解L和S时用到了软阈值算子(也称为收缩算子) Λ λ ( x ) = x ∣ x ∣ m a x ( ∣ x ∣ − λ , 0 ) \Lambda_\lambda(x)=\frac{x}{|x|}max(|x|-\lambda,0) Λλ(x)=xxmax(xλ,0),每一步迭代更新L和S,最后利用得到的L和S计算矩阵M

算法流程:

③增广拉格朗日和ADMM

由于 l 1 l_1 l1范数不可微,可以采用变量分离法(Variable Splitting Method),如增广拉格朗日算法等,通过引入辅助变量,将上面带TV算子约束项的优化问题替换为一个包含辅助变量的等式约束最小化问题,Junfeng Yang等人[5]引入辅助变量 w = [ w 1 , . . . , w N ] , w i ∈ R 2 w=[w_1,...,w_N],w_i\in R^2 w=[w1,...,wN],wiR2 z ∈ R N z\in R^N zRN,问题建模为:
m i n w , z , u   ∑ i ∣ ∣ w i ∣ ∣ + τ ∣ ∣ z ∣ ∣ 1 + 1 2 μ ∣ ∣ F p u − f p ∣ ∣ 2 2 , s . t . w i = D i u , ∀ i ;   z = Ψ T u \underset{w,z,u}{min} \ \underset{i}{\sum} ||w_i||+\tau ||z||_1+\frac{1}{2}\mu||F_pu-f_p||_2^2, \\ s.t. w_i=D_iu,\forall i;\ z=\Psi^Tu w,z,umin i∣∣wi∣∣+τ∣∣z1+21μ∣∣Fpufp22,s.t.wi=Diu,i; z=ΨTu
其中 u u u表示待重建图像, f p f_p fp为到的采集信号, D i u D_iu Diu被定义为全变分(TV)的离散化。

增广拉格朗日方法通过增加罚项,将不光滑不可微的项转变为光滑的表示,

引入函数 ϕ 1 ( s , t , v ) \phi_1(s,t,v) ϕ1(s,t,v) ϕ 2 ( s , t , v → ) \phi_2(s,t,\overrightarrow{v}) ϕ2(s,t,v )分别对应 ∣ ∣ z ∣ ∣ 1 ||z||_1 ∣∣z1项和 ∣ ∣ w i ∣ ∣ ||w_i|| ∣∣wi∣∣项,
ϕ 1 ( s , t , v ) = τ ∣ s ∣ − v ( s − t ) + ( β 1 / 2 ) ∣ s − t ∣ 2 ϕ 2 ( s , t , v → ) = τ ∣ ∣ s ∣ ∣ − v → T ( s − t ) + ( β 2 / 2 ) ∣ ∣ s − t ∣ ∣ 2 \phi_1(s,t,v) = \tau|s|-v(s-t)+(\beta_1/2)|s-t|^2 \\ \phi_2(s,t,\overrightarrow{v}) = \tau||s||-\overrightarrow{v}^T(s-t)+(\beta_2/2)||s-t||^2 ϕ1(s,t,v)=τsv(st)+(β1/2)st2ϕ2(s,t,v )=τ∣∣s∣∣v T(st)+(β2/2)∣∣st2
这样不可微的项就变成了一个二次凹函数,上述约束问题对应的增广拉格朗日函数为:
L A ( w , z , u , λ 1 , λ 2 ) = ∑ i ϕ 2 ( w i , D i u , ( λ 2 ) i ) + ∑ i ϕ 1 ( z i , Ψ i T u , ( λ 1 ) i ) + 1 2 μ ∣ ∣ F p u − f p ∣ ∣ 2 2 L_A(w,z,u,\lambda_1,\lambda_2) =\underset{i}{\sum}\phi_2(w_i,D_iu,(\lambda_2)_i)+\underset{i}{\sum}\phi_1(z_i,\Psi_i^Tu,(\lambda_1)_i)+\frac{1}{2}\mu||F_pu-f_p||_2^2 LA(w,z,u,λ1,λ2)=iϕ2(wi,Diu,(λ2)i)+iϕ1(zi,ΨiTu,(λ1)i)+21μ∣∣Fpufp22
增广拉格朗日函数的求解可以通过下面的迭代流程:

在这里插入图片描述

虽然解决了不可微的问题,但迭代求解第一项仍然是很麻烦的,为了保证ALM的收敛性,在乘子迭代更新之前,需要将每个最小化子问题求解到一定的高精度,并且第一项要达到 w , z , u w,z,u w,z,u的联合最小化。此时可以利用交替乘子迭代法(ADMM),利用 L A L_A LA中变量的可分离结构,每次迭代时仅执行一次交替最小化,然后立即更新乘子,大大降低迭代成本。

算法流程:

在这里插入图片描述

④原始-对偶法

通过构建原始变量 x x x的对偶变量 z z z,在原始变量 x x x和对偶变量 z z z交替迭代更新[6]

参考文献

【1】Lustig M, Donoho D, Pauly JM. Sparse MRI: The application of compressed sensing for rapid MR imaging. Magn Reson Med. 2007

【2】M. Lustig, D. L. Donoho, J. M. Santos and J. M. Pauly, “Compressed Sensing MRI,” in IEEE Signal Processing Magazine, March 2008.

【3】Saman Khoramian, An iterative thresholding algorithm for linear inverse problems with multi-constraints and its applications, Applied and Computational Harmonic Analysis, 2012

【4】Otazo R, Candès E, Sodickson DK. Low-rank plus sparse matrix decomposition for accelerated dynamic MRI with separation of background and dynamic components. Magn Reson Med. 2015 Mar

【5】Yang, Junfeng et al. “A Fast Alternating Direction Method for TVL1-L2 Signal Reconstruction From Partial Fourier Data.” IEEE Journal of Selected Topics in Signal Processing 4 (2010): 288-297.

【6】Chambolle, A., Pock, T. A First-Order Primal-Dual Algorithm for Convex Problems with Applications to Imaging. J Math Imaging Vis 40, 120–145 (2011).

【7】压缩感知原理简介_vivian_ll的博客-CSDN博客_压缩感知

【8】共轭梯度法(二):非线性共轭梯度 - 知乎 (zhihu.com)

【9】[近端梯度下降与软阈值迭代:PGD and ISTA_三生断绝的博客-CSDN博客](https://blog.csdn.net/qq_42122496/article/details/106039034#:~:text=通常我们将 l1 范数对应的临近点算子称为软阈值,将 l0 范数对应的临近点算子称为硬阈值。 软阈值迭代算法,(ISTA%2C iterative soft-thresholding algorithm) ,即为用软阈值作为包含 l1 范数的目标函数的“梯度”,使用“梯度下降”来得到最优值的算法。)

【10】 优化算法-3|增广拉格朗日函数(ALM)及其优化方法-ADMM算法、AMA算法 - 知乎 (zhihu.com)

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值