有效的亚像素图像配准算法

比较了采用非线性优化和矩阵乘离散傅里叶变换的三种二维图像配准算法。这些算法的精度与传统的快速算法相当。傅里叶变换上采样方法在一小部分的计算时间和与大大减少内存要求。比较它们的精度和计算时间,以评估平移不变误差度量。

在各种各样的应用中,人们通常希望将两个图像注册到一个像素的一小部分内,以便进行图像处理任务或评估。在这项工作中,我们主要关注通过相位检索来评价重构图像[1,2],对于这一点,二维刚性平移就足够了。其他应用程序也可以发现,虽然更创收费员转换通常是必需的,在遥感数据的处理,生物和医学图像放大,计算机视觉,与相关任务响ingfrom超限分辨[3],斑纹和噪音增加[4],运动和变更跟踪,和立体视觉[5] [6 - 8]

对于仅在两个图像之间进行转换的情况,解决此问题的常用技术是通过快速傅里叶变换(FFT)计算要注册的图像和参考图像之间的上采样互相关,并定位其峰值。与这种方法相关的计算负担随着注册所需的交流权限的增加而增加,特别是在内存方面。例如,对于1024×1024的图像,在1/20像素范围内进行配准需要20480×20480逆FFT的处理和存储,而目前大多数单点计算机无法做到这一点。

在本文中,我们提出了三种基于非线性优化和离散傅里叶变换(DFTs)的有效的配准算法,它们允许两幅具有较大的采样因子的图像的精确配准。在计算图像质量的平移不变误差度量时,我们测试了这些算法的精度和计算速度。与通常的FFT方法相比,这些算法具有更短的计算时间和更少的内存需求。

对于相位检索重建图像的问题,可以通过测量f(x,y)的傅里叶变换的幅值对f(x,y)的图像g(x,y)进行数值重建[1,2]。在这种情况下,一个重构g(x,y)被认为是成功的,即使它有一个全局坐标平移(x0,y0)或者乘以一个任意常数a。重构的质量必须通过一个对这些操作不变的误差度量来实现。其中一个度量是由[9]定义的f(x,y)和g(x,y)之间的标准化均方根误差(NRMSE) E

E 2 = min ⁡ α , x 0 y 0 ∑ x , y ∣ ag ⁡ ( x − x 0 , y − y 0 ) − f ( x , y ) ∣ 2 ∑ x , y ∣ f ( x , y ) ∣ 2 = 1 − x 0 y 0 ∑ x , y ∣ f ( x , y ) ∣ 2 ∑ x , y ∣ g ( x , y ) ∣ 2 \begin{aligned} E^{2}=& \min _{\alpha, x_{0} y_{0}} \frac{\sum_{x, y}\left|\operatorname{ag}\left(x-x_{0}, y-y_{0}\right)-f(x, y)\right|^{2}}{\sum_{x, y}|f(x, y)|^{2}} \\=& 1-\frac{x_{0} y_{0}}{\sum_{x, y}|f(x, y)|^{2} \sum_{x, y}|g(x, y)|^{2}} \end{aligned} E2==α,x0y0minx,yf(x,y)2x,yag(xx0,yy0)f(x,y)21x,yf(x,y)2x,yg(x,y)2x0y0
其中对所有图像点求和(x, y) ;

r f g ( x 0 , y 0 ) = ∑ x , y f ( x , y ) g ∗ ( x − x 0 , y − y 0 ) = ∑ u , p F ( u , v ) G ∗ ( u , v ) exp ⁡ [ i 2 π ( u x 0 M + v y 0 N ) ] \begin{aligned} r_{f g}\left(x_{0}, y_{0}\right) &=\sum_{x, y} f(x, y) g^{*}\left(x-x_{0}, y-y_{0}\right) \\ &=\sum_{u, p} F(u, v) G^{*}(u, v) \exp \left[i 2 \pi\left(\frac{u x_{0}}{M}+\frac{v y_{0}}{N}\right)\right] \end{aligned} rfg(x0,y0)=x,yf(x,y)g(xx0,yy0)=u,pF(u,v)G(u,v)exp[i2π(Mux0+Nvy0)]
为f(x,y)与g(x,y)的互相关;N和M为图像的维数:(*)表示复连词;大写字母表示对应的小写字母的DFT,由关系给出

F ( u , v ) = ∑ x , y f ( x , y ) M N exp ⁡ [ − i 2 π ( u x M + v y N ) ] F(u, v)=\sum_{x, y} \frac{f(x, y)}{\sqrt{M N}} \exp \left[-i 2 \pi\left(\frac{u x}{M}+\frac{v y}{N}\right)\right] F(u,v)=x,yMN f(x,y)exp[i2π(Mux+Nvy)]
E2相对于[9]是最小的。因此,Eq.(1)对NRMSE的评估需要通过定位交叉相关的峰值 r f g ( x , y ) r_{f g}(x, y) rfg(x,y)来解决更一般的亚像素图像配准问题

通常的FFT方法afraction内找到互相关峰值, 1 / κ 1 / \kappa 1/κ,一个像素是(i)计算 F ( u , v ) F(u, v) F(u,v) G ( u , v ) G(u, v) G(u,v)(ii)将 F ( u , v ) G ∗ ( u , v ) F(u, v) G^{*}(u, v) F(u,v)G(u,v)嵌入尺寸为( κ M , κ N \kappa M, \kappa N κM,κN)的一组更大的零数组中,(iii)计算逆FFT以获得向上采样的互相关,(iv)定位高峰。在本例中,对于 N ⩽ M . N \leqslant M . NM.,逆FFT的计算复杂度为 O { M N K [ log ⁡ 2 ( κ M ) + κ log ⁡ 2 ( κ N ) ] } O\left\{M N_{K}\left[\log _{2}(\kappa M)+\kappa \log _{2}(\kappa N)\right]\right\} O{MNK[log2(κM)+κlog2(κN)]}

作为这种方法的有效替代品,我们开发了三种不同的算法,在不牺牲准确性的情况下显著提高了性能。这三种算法都是从FFT方法得到的互相关峰值位置的初始估计开始,向上采样因子 κ 0 = 2 \kappa_{0}=2 κ0=2。这种初始向上采样是用来为可能有不止一个相似磁峰的相互关系选择一个合适的起始点。

第一个算法,首先在[9]中提出,但没有实现,利用非线性优化共轭梯度例程[10]优化初始估计,以最大化 ∣ r f g ( x 0 , y 0 ) ∣ 2 \left|r_{f g}\left(x_{0}, y_{0}\right)\right|^{2} rfg(x0,y0)2。它对 x 0 x_{0} x0的偏导数是
∂ ∣ r f g ( x 0 , y 0 ) ∣ 2 ∂ x 0 = 2 Im ⁡ { r f g , y 0 ) ∑ u , v 2 π u M F ∗ ( u , v ) × G ( u , v ) exp ⁡ [ − i 2 π ( u x 0 M + v y 0 N ) ] } \begin{aligned} \frac{\partial\left|r_{f g}\left(x_{0}, y_{0}\right)\right|^{2}}{\partial x_{0}}=& 2 \operatorname{Im}\left\{r_{f g}, y_{0}\right) \sum_{u, v} \frac{2 \pi u}{M} F^{*}(u, v) \\ &\left.\times G(u, v) \exp \left[-i 2 \pi\left(\frac{u x_{0}}{M}+\frac{v y_{0}}{N}\right)\right]\right\} \end{aligned} x0rfg(x0,y0)2=2Im{rfg,y0)u,vM2πuF(u,v)×G(u,v)exp[i2π(Mux0+Nvy0)]}
y 0 y_{0} y0的偏导也有类似的表达式。该算法迭代搜索使 r f g ( x 0 , y 0 ) r_{f g}\left(x_{0}, y_{0}\right) rfg(x0,y0)最大化的图像位移 ( x 0 , y 0 ) \left(x_{0}, y_{0}\right) (x0,y0),并能在任意像素分块内实现配准精度。

第二种算法,我们称之为单步DFT方法,使用了2D DFT的矩阵乘法实现[11.121]。如。(3)、细化初始峰值位置估计。当需要计算上采样互相关的所有点时,二维FFT是最有效的方法。不幸的是,FFT仅限于计算整个上采样阵列的维数 ( κ M , κ N ) (\kappa M, \kappa N) (κM,κN),如果我们只对一个非常小的邻域内的 r f g ( x 0 , y 0 ) r_{f g}\left(x_{0}, y_{0}\right) rfg(x0,y0)的上采样版本的峰值位置的初始估计感兴趣,这将导致巨大的资源浪费。矩阵乘DFT的优势在于,向上采样的 r f g ( x 0 , y 0 ) r_{f g}\left(x_{0}, y_{0}\right) rfg(x0,y0)可以在这样的邻域内计算,而不需要对 F ( u , v ) G ∗ ( u , v ) F(u, v) G^{*}(u, v) F(u,v)G(u,v)进行零填充。在单步DFT算法中,初始估计是在一个1.5×1.5像素的邻域内(以原始像素为单位)计算上采样的互相关(由一个因子 κ \kappa κ)。这个运算是由三个维度(1.5 κ \kappa κ, N N N), ( N N N, M M M)和( M M M,1.5 κ \kappa κ)的矩阵的乘积来实现的。通过在输出 ( 1.5 κ , 1.5 κ ) (1.5 \kappa, 1.5 \kappa) (1.5κ,1.5κ)数组(以上采样像素为单位)中搜索峰值,实现亚像素配准。假设 κ \kappa κ小于 M M M and N N N,则上采样的算法复杂度为 O ( M N κ ) O(M N \kappa) O(MNκ);与FFT上采样法相比有了很大的改进。

随着所需配准精度的提高,在细化初始( κ 0 \kappa{0} κ0=2)转换估计值时采用两步矩阵乘DFT方法证明进一步减少计算样本的数量很有用。两步DFT算法最初对1.5×1.5像素区域进行升采样,采样率约为初始估计的 κ 1 ≃ κ 1 / 2 \kappa_{1} \simeq \kappa^{1 / 2} κ1κ1/2,并在该阵列中找到互相关峰值。在第二步中,通过对新估计周围的原始像素网格的 3 / κ 1 × 3 / κ 1 3 / \kappa_{1} \times 3 / \kappa_{1} 3/κ1×3/κ1较小区域进行上采样全因数来进一步细化峰位置。以这种方式,细化算法的复杂度降低到 O ( M N κ i / 2 ) O\left(M N \kappa^{\mathrm{i} / 2}\right) O(MNκi/2)。对于FFT,单步和两步DFT方法,这种平移估计的精度( κ − 1 \kappa^{-1} κ1)与FFT相同

为了评估和比较各种算法的性能,我们使用相加的零均值圆形com形高斯噪声 n ( x , y ) n(x, y) n(x,y)对一个256×256复值图像 f ( x , y ) f(x, y) f(x,y)进行了破坏,并通过 ( x 0 , y 0 ) \left(x_{0}, y_{0}\right) (x0,y0) =(502/21,52/15)像素对其进行了平移以生成 g ( x , y ) g(x, y) g(x,y)。本例中不变NRMSE E的估计结果如图1(a)所示,相对于真实的NRMSE E,其中 E 2 = ∑ x , y ∣ n ( x , y ) ∣ 2 / ∑ x , y ∣ f ( x , y ) ∣ 2 E^{2}=\sum_{x, y}|n(x, y)|^{2} / \sum_{x, y}|f(x, y)|^{2} E2=x,yn(x,y)2/x,yf(x,y)2。当NRMSE趋近于0时,使用高赋值因子k或非线性优化例程变得至关重要,以避免对e的过高估计。通过计算移位误差( Δ r = [ ( x 0 − x ^ 0 ) 2 + ( y 0 − y ^ 0 ) ] 1 / 2 \Delta r=\left[\left(x_{0}-\hat{x}_{0}\right)^{2}\right.\left.+\left(y_{0}-\hat{y}_{0}\right)\right]^{1 / 2} Δr=[(x0x^0)2+(y0y^0)]1/2如图1(b) for E E E=0.25所示)来确定估计平移量(xo,jo)的精度。为了便于比较,我们还将得到的Ar与不需要指定k的非线性优化例程进行了比较。对于 E E E=0.25这一较大的值,使用较高的上采样因子(即 K K K=10)进行估计,得到的收益递减[图3]。1(a)],但是从图1(b)中可以看出,更大的k值和更大的非线性优化算法对配准精度有显著的好处。最终配准精度将受到噪声的限制。

image-20201116093706276

图1所示。(a)不变的NRMSE估计值与E (b) E=0.25时估计图像位移Ar与上采样因子k的误差。虚线表示无噪声的最大误差1/(\2k)。对于优化算法,Ar=0.0029像素(虚线曲线)。

三种算法在台式机(AMD Athlon X2双核处理器2.21 GHz, 64位操作系统,4 Gbytes RAIM)上的计算时间比较如图2所示。2×上采样FFT方法获得ini估计所需的时间包含在时间测量中,并明确显示以供比较。初步估计被发现支配了总计算时间。图2(a)显示了 E E E=0.22时配准算法相对于图像大小的计算时间(DFT算法的 κ \kappa κ=25)。对于相同噪声量的512×512张图像,计算时间k的函数如图2(b)所示。给出了非线性优化算法的计算时间,并进行了比较;它与 κ \kappa κ无关。假设两个双精度复值数组,在同一台计算机上可以执行FFT的最大阵列大小为11585×11585。这相当于传统FFT上采样方法的最大图像大小为463×463, κ \kappa κ=25,取235 s,而单步DFT算法取0.78 s。注意,使用FFT upsampling方法注册 κ \kappa κ=25的2048 x 2048个图像需要超过78 gb的RAM。

与单步DFT方法相比,两步DFT方法在计算时间上减少的上采样量与图像大小有关。相交点分别出现在图像大小为64×64、256×256和512 x 512的 κ \kappa κ= 20,30和45处。虽然非线性优化方法在任何情况下都是最耗时的,但由于它不受向上采样因子的限制,并且可以检索任意的分数阶变换值,因此具有最高的精度。

image-20201116093731850

图2所示。(彩色在线)相对于(a)图像大小(DFT算法为 κ = 25 \kappa=25 κ=25)和(b) 512 x 512图像的上采样因子的计算时间。

通过互相关实现的亚像素图像配准特别适合于相位检索重建的图像的比较,在相位检索中,将翻译后的解乘以一个全局复杂因子被认为是一种成功的配准。在低噪声环境下,利用非线性优化或高阶采样因子对E的精确计算尤为重要。翻译估计的准确性很大程度上得益于较大的上采样因子,即使存在中等数量的噪声。这三种算法可以直接扩展到包含互相关方法的变量,如相位相关,并包含窗口函数来计算边缘效果[13]。

虽然其他方法(如曲线拟合互相关峰值[4]或随机抽样方法[81])可以显著更快地实现亚像素图像配准,但它们在配准过程中牺牲了精度。与FFT上采样方法一样,我们的算法总是使用图像中所有可用的信息来计算初始估计和上采样互相关网格中的每个点,从而使它们对噪声具有很强的鲁棒性。

线性优化算法),但大大减少了计算时间和内存需求。使用这些算法可以精确地注册大型图像,甚至在需要的情况下可以精确到百分之一像素内,在普通的桌面计算机上可进行计算管理,对于任何需要亚像素图像注册的应用程序来说,这将被证明是一个巨大的优势。

部分工作以[14]的形式呈现。

Efficient subpixel image registration algorithms

References

  1. J. R. Fienup, Opt. Lett. 3, 27 (1978).
  2. J. R. Fienup, Appl. Opt. 21, 2758 (1982).
  3. M. Irani and S. Peleg, CVGIP: Graph. Models Image Process. 53, 231 (1991).
  4. A. R. Wade and F. W. Fitzke, Opt. Express 3, 190(1998).
  5. M. D. Pritt, J. Opt. Soc. Am. A 10, 2187 (1993).
  6. L. G. Brown, ACM Comput. Surv. 24, 325 (1992).
  7. B. Zitová and J. Flusser, Image Vis. Comput. 21, 977 (2003).
  8. P. Viola and W. M. Wells III, Int. J. Comput. Vis. 24, 137 (1997).
  9. J. R. Fienup, Appl. Opt. 36, 8352 (1997).
  10. W. H. Press, S. A. Teukolsky, W. T. Vetterling, and B. P. Flannery, Numerical Recipes in Fortran 77 (Cambridge U. Press, 1992).
  11. H. H. Barrett and K. J. Myers, Foundations of Image Science (Wiley, 2004), p. 172.
  12. R. Soummer, L. Pueyo, A. Sivaramakrishnan, and R. J. Vanderbei, Opt. Express 15, 15935 (2007).
  13. S. T. Thurman and J. R. Fienup, Proc. SPIE 6233,62330S (2006).
  14. M. Guizar-Sicairos, S. T. Thurman, and J. R. Fienup, in Signal Recovery and Synthesis, 2007 OSA Technical Digest Series (Optical Society of America, 2007), SMC3.
  • 2
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
### 回答1: 图像是指通过Matlab软件来实现对图像进行高精度的。在图像过程中,我们常常需要将多张图像进行对齐,以实现图像融合、图像分析等应用。常规的图像主要依靠像级别的变换,而图像则可以进一步提高的精度。 Matlab提供了一系列的图像处理工具箱,其中就包含了图像相关的函数和算法。在进行图像之前,首先需要确定的参考图像和待图像。然后,可以利用Matlab中的imregconfig函数进行初始化设置,包括选定算法、设定最优化目标等。 接下来,可以利用imregister函数实现图像。imregister函数提供了多种算法的选择,如基于特征的、基于相位相关的等。可以根据具体的需求选择适合的算法进行操作。使用imregister函数,我们可以得到级别的结果。 在实际应用中,常常需要对多幅图像进行批量的图像。这时可以使用imregtform函数实现多幅图像,该函数可以同时多张图像,提高了的效率和确性。 总之,通过Matlab提供的函数和算法,我们可以很方便地实现图像。这种方法可以提高图像的精度,适用于各种科研和工程应用中对图像精度要求较高的场景。 ### 回答2: MATLAB图像是一种高精度的图像方法,用于将不同图像间的特征点或特征区域对齐。通过使用插值算法,将像级别的细化到级别,从而提高的精度。 图像的步骤如下: 1. 特征提取:从待图像中提取特征点或特征区域。常用的特征包括角点、边缘等。 2. 特征匹:对两幅图像中提取的特征进行匹,找出相对应的特征点或特征区域。 3. 初始变换估计:通过已匹的特征点计算出初始的变换参数,如平移矩阵、仿射矩阵或透视变换矩阵。 4. 细化:在初始变换的基础上,使用插值算法进一步细化变换参数,以达到级别的精度。 5. 图像重采样:根据计算得到的级别的变换参数,对待图像进行重采样,使得待图像与参考图像的特征点或特征区域对齐。 MATLAB提供了丰富的函数和工具箱来实现图像,如SURF特征提取函数、SIFT特征提取函数、图像工具箱等。通过调用这些函数和工具箱中的相关函数,可以实现快速、确的图像图像在医学图像处理、遥感影像、计算机视觉等领域具有广泛的应用,能够提高图像处理和分析的精度和确性。 ### 回答3: Matlab是一种功能强大的科学计算软件,它也提供了许多图像处理工具和函数,其中包括图像图像是在像级别之间进行更精确的图像,使得不仅可以进行像级别的匹,还能够在像之间进行更细微的调整。 在Matlab中,可以使用imregconfig和imregister函数来执行图像。首先,我们需要创建一个imregconfig对象,并设置其属性来过程中的参数和选项。然后,可以使用imregister函数来执行图像,并将置对象作为参数传递给该函数。 过程中的一些重要参数包括:精度(SubPixelResolution),相似度度量度(Metric)和转换类型(Transformation Type)。精度决定了的精细程度,而相似度度量度可以选择不同的测量方法来评估图像之间的相似度。转换类型可以选择不同的变换模型,如平移、旋转、缩放等。 图像的过程可以分为以下几个步骤: 1. 读取待图像,并预处理图像,如灰度化、去噪等。 2. 创建imregconfig对象,并设置参数。 3. 调用imregister函数来执行图像,传递待图像和参考图像作为输入参数。 4. 可选地,可以对后的图像进行后处理,如调整亮度、对比度等。 5. 可选地,可以将结果进行可视化展示,例如绘制图像重叠等。 总之,Matlab提供了强大的图像功能,可以帮助我们实现更精确的图像。通过适当参数和选项,可以根据具体需求进行不同类型的图像任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值