【数字图像处理】简单粗暴理解伽马变换（附python代码）

最新推荐文章于 2025-03-03 20:20:54 发布

MJ_Hu

最新推荐文章于 2025-03-03 20:20:54 发布

阅读量2.3k

点赞数 15

分类专栏：数字图像处理文章标签： python 图像处理

本文链接：https://blog.csdn.net/fbzhl/article/details/142636886

版权

数字图像处理专栏收录该内容

3 篇文章

订阅专栏

文章目录

1 概念
2 原理
3 python代码实现（两种方法）
4 拓展延伸——伽马校正

1 概念

伽马（Gamma）变换又称幂律变换，是数字图像处理中的一种常用技术，其作用主要是调节图像的亮度，从而增强图像的对比度。日常生活中我们使用一些图像处理软件调整图片的亮度，其实使用的就是伽马变换。

喜欢打游戏的可能对这样一个场景并不陌生，许多主机游戏第一次启动时会让用户调整显示亮度直到能隐约看见某个东西（某个文字之类的），这其实就是在应用伽马变换调节屏幕亮度，以输出更佳的画面。

其实伽马变换的原理是非常简单的，下面就以最通俗易懂的方式来介绍一下。

2 原理

2.1 数学原理

伽马变换的形式是非常简单的，就是如下公式： $s=cr^\gamma,\ r \in [0,1]$ 其中， $r$ 是某个点变换前的像素值， $s$ 是变换后的像素值， $c$ 和 $\gamma$ 是正常数（ $\gamma$ 其实就是伽马）。 一般我们会令c等于1。 在一些情况下，考虑到偏移问题（当输入为0时的一个可度量输出）， $r$ 这一项也可以写成 $(r+\varepsilon)$ ，但是多数情况下我们一般对这个偏移忽略不计，所以还是使用上式给出的形式。

2.2 像素值的归一化

这里注意到 $\in [0,1]$ ，我们知道现实中的图像大部分都是256个灰度（如果是彩色图像，每一个通道对应256个等级）。这里很容易理解，如果直接带入过百的数值进行幂律计算，得到的结果会很大，显然无法使用。所以在这里要将 $r$ 进行归一化处理，将其划入[0, 1]这个区间，这样无论执行怎样的幂运算，最终的计算结果都不会跑出这个区间。

归一化如何实现呢？其实也非常容易。假设我们现在处理的是256个灰度级的灰度图像（彩色图像同理），在执行伽马变换时只需要将原像素值除以255（因为256个灰度级对应的区间是[0, 255]）后进行映射，之后再将映射得到的值乘上255，就可以恢复出我们预期的变换值了。

2.3 关于 $\gamma$ 值如何选取的讨论

上述我们已经介绍了伽马变换的基本公式，也介绍了公式中的几个比较容易理解的参数，现在还剩下 $\gamma$ 这个主角尚待解决。

其实只要懂幂函数，仅限于中学最基本的幂函数知识，这个问题也非常容易理解。首先我们已经知道，公式中的 $c$ 大部分情况下等于1，所以c对输出结果影响是不大的。其实就算c不是1，它也并不能对结果起到决定性作用，因为c仅仅是一个常数项（这一段有些类似时间复杂度的计算，我们会认为常数项的影响远远不如指数项）。因此我们就将关注点转向 $\ r^\gamma$ 这一项。

由于我们已经人为对r进行归一化，使r永远在区间[0, 1]内。等于1的情况可以不用考虑，我们来看小于1的情况。根据指数函数的知识，此时如果 $\gamma>1$ ，那么算出的结果肯定比r小，反之如果 $\gamma \in (0,1)$ ，算出的结果肯定比r大。 这个应该怎么在灰度值层面理解呢？假如对一幅图片进行大于1的伽马处理，那么对这张图片的每一个像素进行变换之后，得到的新像素值都会更小，对应的图片就会变得更暗，反之图片就会变得更亮。因此得出结论： $\gamma>1$ ，图像会变暗； $\gamma \in (0,1)$ ，图像会变亮。实际中面对不同亮度的原图像，就可以根据我们的需求动态选择 $\gamma$ 。

下图就展示了在不同 $\gamma$ 值下，输入灰度级和输出灰度级之间的映射关系。可以很明显的发现上述得出的结论是正确的。
![[Pasted image 20240929150846.png]]

3 python代码实现（两种方法）

3.1 不查找表法

其实这就是最朴素的方法，即对于每个像素分别计算其映射后的像素值。叫它不查找表法其实是为了与下文中的查找表法进行对比。

# 不使用查找表gamma变换  
def gamma_not_search(src_img, gamma, c=1):  
    """    
    Gamma变换——不使用查找表法
	    :param src_img: 原图像
	    :param gamma: Gamma系数    
	    :param c: 常数项，默认为1，可缺省    
	    :return: Gamma变换后的新图像    
    """    
    # 获取原图像宽高并创建新底图**  
    height, width = src_img.shape[:2]  
    dst_img = np.zeros((height, width, 3), dtype=np.uint8)  
      
    # 遍历每个像素点，对其进行gamma变换  
    for row in range(height):  
        for col in range(width):

            normalized_pixel = src_img[row, col] / 255.0    **# 归一化处理**  
            dst_pixel = pow(c * normalized_pixel, gamma) * 255    
            dst_img[row, col] = np.clip(dst_pixel, 0, 255)  
    return dst_img

3.2 查找表法

不查找表法实际上会执行很多重复的计算。如对于相同像素较多的图片，每一次变化都得重新计算一次该像素的映射值，但显然前面的计算已经得到了结果，这样就造成了冗余计算。

查找表法其实是这样的一个思路：对于数字图像，其灰度等级是确定的，我们最常用的等级是256个等级，也就意味着无论图片有多大，每个像素的取值只可能在[0, 255]之间。而在 $\gamma$ 相同的情况下对于每个输入像素值，其对应的输出像素值是恒定的。因此，我们只需要建立一个映射表，将256个原始像素值分别于它们的映射像素值建立映射关系，之后进行伽马变换时只需要查表替换，就不在需要执行重复的计算，而是直接查表替换即可。

# 使用查找表gamma变换

def gamma_search(src_img, gamma, c=1):  
    """   
    Gamma变换——使用查找表法    
	    :param src_img: 原图像    
	    :param gamma: Gamma系数   
	    :param c: 常数项，默认为1，可缺省   
	    :return: Gamma变换后的新图像    
    """  
    # 获取原图像宽高并创建新底图  
    height, width = src_img.shape[:2]  
    dst_img = np.zeros((height, width, 3), dtype=np.uint8)  
      
    # 创建线性查找表 
    fx = np.empty(256, dtype=np.uint8)  
    for i in range(256):  
        fx[i] = np.clip(pow(c * (i / 255.0), gamma) * 255, 0, 255)  
  
    # 遍历每个像素点，查表进行像素替换
    for row in range(height):  
        for col in range(width):  
            dst_img[row, col] = fx[src_img[row, col]]  
    return dst_img