深入浅出图像处理：从像素到高级变换的全面解析

凭栏落花侧

已于 2024-09-23 12:00:55 修改

阅读量227

点赞数 6

文章标签：笔记图像处理学习开发语言人工智能 python 经验分享

于 2023-11-21 17:00:55 首次发布

本文链接：https://blog.csdn.net/m0_67484548/article/details/134527383

版权

本文介绍了数字图像处理的基础知识，包括图像的定义、访问方式、RGB序列化。讨论了图像的仿射变换和线性变换，以及灰度处理算法，如图像反转、对数变换和伽马变换。此外，还提到了空间域的概念及其在图像处理中的应用，如直方图均衡化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

什么是图像

通过成像系统（相机）拍摄，数字化之后的图像就是一个二维数组（矩阵）。

如何访问图像

访问顺序：red -> green -> blue

宽高通道

图像有单通道和多通道之分，访问时只需要以多维数组的形式访问即可。

下面是一个代码示范：

import numpy as np

# 假设 image 是一个 NumPy 数组，形状为 (nHeight, nWidth, nChannel)
# 其中 nChannel 通常为 3，代表 RGB 通道

# 定义图像数据的大小
nHeight = 100  # 图像的高度
nWidth = 100   # 图像的宽度
nChannel = 3   # 图像的通道数，通常是3（RGB）

# 创建一个随机的三维数组来模拟图像数据
image = np.random.randint(0, 256, (nHeight, nWidth, nChannel), dtype=np.uint8)

# 遍历图像数据
for i in range(nHeight):
    for j in range(nWidth):
        for k in range(nChannel):
            # 访问第i行，第j列，第k通道的像素值
            pixel_value = image[i, j, k]
            # ... 对像素值进行处理
            # 例如，这里我们只是打印出来
            print(f"Pixel value at ({i}, {j}, {k}) is: {pixel_value}")

我们首先导入了NumPy库，并创建了一个形状为(nHeight, nWidth, nChannel)的随机数组

来模拟图像数据。

然后，我们使用三个嵌套的for循环来遍历图像的每个像素值。

TIPS：图像就是多维数组

将 RGB图像序列化：

import numpy as np

# 假设 image 是一个 NumPy 数组，形状为 (nHeight, nWidth, 3)
# 其中 nHeight 和 nWidth 分别代表图像的高度和宽度

# 定义图像数据的大小
nHeight = 100  # 图像的高度
nWidth = 100   # 图像的宽度

# 创建一个随机的三维数组来模拟图像数据
image = np.random.randint(0, 256, (nHeight, nWidth, 3), dtype=np.uint8)

# 遍历图像数据，按照RGB顺序打印每个像素的颜色值
for i in range(nHeight):
    for j in range(nWidth):
        # 打印RGB通道的值
        print(f"R: {image[i, j, 0]}, G: {image[i, j, 1]}, B: {image[i, j, 2]}")

我们首先导入了NumPy库，并创建了一个形状为(nHeight, nWidth, 3)的随机数组来模拟图

像数据。然后，我们使用两个嵌套的for循环来遍历图像的每个像素，并按照RGB顺序打印每个像

素的颜色值。

问：什么是图像仿射变换

答：仿射变换就是 线性变化+平移

问：什么是线性变换

答：线性变换是

① 变换前是直线的，变换后依然是直线

② 直线比例保持不变

常见的灰度处理算法

问：常见的灰度变换有哪些

答：