本文工作
这篇博客主要是对原论文做整体上的概述,并非一句句的翻译,本人水平时间有限。如果有细节上的疑问的话,最好还是下载原文去校对一下,当然也欢迎留言讨论。
原文信息
先上原文标题:Image Enhancement via Adaptive Unsharp Masking
原文作者:Andrea Polesel, Giovanni Ramponi, and V. John Mathews
背景简介
论文一开始第一部分第一段就提及了经典的非锐化掩膜算法(即原文提及的UM算法),第一段主要说明经典的UM算法存在两个问题:1.对噪声极其敏感 2.增强结果会出现伪影。
PS:这里补充一下,UM算法就是将图像先平滑处理,例如拿3×3的卷积核作均值滤波,然后用原图像减去均值滤波后的图像得到丢失的高频细节,最后再将丢失的高频细节加回到原图像上,完成高频细节的增强。但同理,噪声也是高频信息所以会出现问题1。问题2的出现需要一个图,如下图:
比如原图是两边都是120灰度级,只有中间是0即黑色的一条线;在均值滤波后,变成了中间三条80的灰色线;之后原图减去滤波后图像,得到左下角这样的图;把这样的高频信息加到原图,神奇的事情发生了,我们发现0旁边多了两条160的亮线,这就是伪影也即问题2产生的原因(0-80还是0是因为最小灰度值是0)
论文第一部分第二段,开始阐述前人针对UM算法出现的问题,做出的成果:
1和2的论文中,给出了局部自适应加权的改进策略
3的论文中,根据韦伯定律,提出了局部均值加权的策略
2和4的论证中还提出了新的多项式图像增强策略
5的论文中提出了基于拉普拉斯算子的图像增强策略
6的论文中提出了用于图像增强的非线性自适应滤波器
论文第一部分第三段,总结了第二段这些人的工作。他们对于UM算法中噪声的问题解决有贡献,但仍然会带来伪影的问题。而且他们的方法对于中对比度和大对比度的地方并没有增强(这句我也不太理解,希望有大佬不吝赐教)。7的论文中提出基于输入对比度的自适应图像自动锐化方法,但这个算法可以增强的图像的动态范围必须与CRT动态范围相匹配,否则就会出现很多噪声
论文第一部分第四段,开始简介自己的工作。作者说自己的目的就是多增强中对比度的细节,而不是高对比度细节以此避免超调效应(overshoot effects)(不晓得这样翻译对不对,原文先粘过来)。然后作者说自己的算法对噪声有更好的鲁棒性,所以他觉得他的算法很好解决了两个问题,是一种新的图像增强算法。
论文第一部分第五段,主要概述了后面论文由哪几部分组成
算法介绍
论文第二部分A部分之前,先简述了什么是UM算法,如图:
x是原图,z是丢失的细节,λ是参数
后来论文描述了他的算法思路,他的算法将丢失的细节拆分成x方向和y方向
再在每个方向前加入不同的参数
最后将公式写成了矩阵形式
论文第二部分A部分,定义价值函数(cost function) 作者先提出了一个测量图像某点对比度程度的算子
如图,作者用这样一个算子来测量图像中某点的对比度大小。其中x(n,m)表示平均亮度级在同样3×3的卷积核里。之后作者又规定了gd(n,m)其中α(n,m)由某点的对比度所决定,低对比度就是1,中对比度是αdh,高对比度就是αdl。
其中gx(n,m)表示点x(n,m)的对比度大小(即对比度值是多少,注意这里不是对比度等级)之后,作者根据前面定义的gd,来定义了价值函数(cost function)
其中gy定义如下(后面还有gy的定义公式,这个暂时先不用管)
论文第二部分B部分,讲述适应算法 作者在这部分先阐述了gy(n,m),如图:
gy(n,m)表示的是输出图像的对比度值,其中gzx,gzy是测量(n,m)局部的zx,zy;Λ(n,m)是参数,由高斯牛顿迭代公式算出来的,如图
其中0<β<1,G(n,m)是输入向量,R(n,m)是对G(n,m)的矩阵估计并进行递归计算。(可能到这大家有点乱,其实他做的就是输入一个图像x得到输出y,而后面计算这些对比度递归什么的是为了反方向去调整前面的参数)整体的算法流程,如图:
后面作者讲述了自己算法在某个参数下,几乎对所有测试图片增强效果都非常好,具体参数如图:
论文第二部分C部分,讲述如何降低算法时间复杂度 这节作者主要罗列了一些降低算法复杂度的策略。作者提到了VLSI技术可以降低算法时间复杂度,另一个就是考虑算法可以通过怎样的简单变化和更简单的实现方法来降低时间复杂度。
实验结果
论文第三部分前言部分, 主要讲和哪些算法作比较,还有为啥用主观评价 这节作者先一上来说,和1、2、4、5、7这些论文中提出的算法作比较,然后又说不用客观评价的三个原因:1.没有标准图像作为参考 2.任何客观评价都是建立在主观人眼视觉系统之上的,但人眼视觉系统有不确定性 3.观察条件会影响到人们的评价结果。
论文第三部分A部分, 讲了图像增强的实验 首先作者先说了用于做实验用的图像是Lena的256级灰度图,且尺寸是256*256的。然后作者说用别人的算法时选的参数不是原论文里的参数,而是选择了让算法尽可能增强对比度且不增强伪影的参数,具体参数见表一(我在上面放了)。最后自然是放实验结果证明自己的算法优秀(由于实验图太占地方我就不放了哈),既然是主观评价作者就开始各种挑刺。(虽然说的对,但主观总觉得有点一家之言的味道)反正就是这个算法有噪声了,那个算法低/中/高对比度增强的不够好了,那个又有伪影了又怎么样的,最后自己的最好。
论文第三部分B部分,讲了自己算法可以用于图像插值的预处理 作者一上来先说了图像插值很重要,然后又说现在图像的上采样下采样会存在模糊效应的问题,丢失图像高频细节,降低图像对比度。所以可以用这种图像对比度增强算法作为图像插值预处理。然后就是实验结果,亦是主观评价。这次作者就放了双三次线性插值的图像作为对比,其他的作者说自己也做了,但篇幅原因就不放了。反正主观对比下来肯定也是自己的算法好,具体怎么个好有兴趣的可以看原论文。
结束语
最后就是作者总结了,说自己论文主要提出了一种自适应的图像对比度增强算法,算法的系数更新用的是高斯牛顿法。然后算法和别的图像对比度增强算法作比较,通过实验结果发现自己算法好。
参考文献
[1] S. K. Mitra and H. Li, “A new class of nonlinear filters for image enhancement,” in Proc. IEEE Int. Conf. Acoustics, Speech, Signal Processing, Toronto, Ont., Canada, May 14–17, 1991, pp. 2525–2528.
[2] G. Ramponi, N. Strobel, S. K. Mitra, and T. Yu, “Nonlinear unsharp
masking methods for image contrast enhancement,” J. Electron. Imag.,
vol. 5, pp. 353–366, July 1996.
[3] T. N. Cornsweet, Visual Perception. New York: Academic, 1970.
[4] G. Ramponi, “A cubic unsharp masking technique for contrast enhancement,” Signal Process., vol. 67, pp. 211–222, June 1998.
[5] Y. H. Lee and S. Y. Park, “A study of convex/concave edges and edge-enhancing operators based on the Laplacian,” IEEE Trans. Circuits Syst.,
vol. 37, pp. 940–946, July 1990.
[6] S. Guillon, P. Baylou, M. Najim, and N. Keskes, “Adaptive nonlinear
filters for 2-D and 3-D image enhancement,” Signal Process., vol. 67,
pp. 237–254, June 1998.
[7] F. P. De Vries, “Automatic, adaptive, brightness independent contrast
enhancement,” Signal Process., vol. 21, pp. 169–182, Oct. 1990.
[8] C. V. D. B. Lambrecht, “Perceptual models and architectures for video
coding applications,” Ph.D. dissertation, EPFL, Lausanne, Switzerland,
1996.
[9] B. Widrow and S. D. Stearns, Adaptive Signal Processing. Englewood
Cliffs, NJ: Prentice-Hall, 1985.
[10] H. S. Hou and H. C. Andrews, “Cubic splines for image interpolation
and digital filtering,” IEEE Trans. Acoust., Speech, Signal Processing,
vol. ASSP-26, pp. 508–517, Dec. 1978.
[11] R. G. Keys, “Cubic convolution interpolation for digital image
processing,” IEEE Trans. Acoust., Speech, Signal Processing, vol.
ASSP-29, pp. 1153–1160, Dec. 1981.