24.8.7学习笔记

最新推荐文章于 2024-08-13 17:31:17 发布

kkkkk021106

最新推荐文章于 2024-08-13 17:31:17 发布

阅读量645

点赞数 19

文章标签：学习笔记计算机视觉

本文链接：https://blog.csdn.net/m0_64006292/article/details/140997817

版权

均值模糊（Mean Blur）

均值模糊是一种线性滤波器，它通过计算局部区域内的像素平均值来替换中心像素的值。这个过程可以平滑图像，减少噪声。具体步骤如下：

选择一个窗口大小：比如3x3、5x5等。
移动窗口：在图像上逐个像素地移动这个窗口。
计算平均值：对于每个窗口位置，计算窗口内所有像素值的平均值。
更新像素值：将计算得到的平均值赋给窗口中心的像素。

均值模糊可以有效地减少高斯噪声，但是它也会使图像边缘变得模糊，因为边缘处的像素值会被平均化。

中值滤波（Median Filter）

中值滤波是一种非线性滤波器，它通过计算局部区域内像素值的中值来替换中心像素的值。这种方法对于去除椒盐噪声（salt and pepper noise）非常有效。具体步骤如下：

选择一个窗口大小：同样可以是3x3、5x5等。
移动窗口：在图像上逐个像素地移动这个窗口。
排序并取中值：对于每个窗口位置，对窗口内所有像素值进行排序，并选取中间值。
更新像素值：将计算得到的中值赋给窗口中心的像素。

中值滤波能够较好地保留图像边缘，同时有效地去除椒盐噪声。然而，如果噪声分布不是椒盐型，或者噪声级别很高，中值滤波的效果可能会减弱。

高斯模糊的工作原理

定义高斯核：高斯核是一个二维的权重矩阵，其值由高斯分布函数生成。该函数的数学表达式为:

应用高斯核：高斯核通常是对称的，中心点具有最高的权重，而离中心越远的点权重越低。这个核会应用于图像上的每一个像素，以计算出新的像素值。
卷积操作：对于图像中的每个像素，使用高斯核与该像素及其周围像素进行卷积操作。这意味着，新像素值是由周围像素值加权求和得到的，其中权重由高斯核提供。
结果：高斯模糊后的图像看起来更加平滑，同时边缘信息得以较好地保持，因为高斯核中心权重较高，可以更好地保留边缘细节。

优点

噪声减少：高斯模糊可以有效减少图像中的高斯噪声。
边缘保护：相比均值模糊，高斯模糊能更好地保留图像的边缘特征。

缺点

计算复杂度：高斯模糊的计算量比简单的均值模糊要大，因为它涉及到权重矩阵的计算。
参数选择：选择合适的 σσ 和核大小可能需要一些试验才能达到理想的效果。

代码如下：

import numpy as np
from scipy.ndimage import gaussian_filter
from PIL import Image
import matplotlib.pyplot as plt


def apply_gaussian_blur(image_path, sigma=2):
    # 加载图像
    image = Image.open(image_path)

    # 将图像转换为灰度图像
    gray_image = image.convert('L')

    # 将图像转换为NumPy数组
    image_array = np.array(gray_image, dtype=np.float32)

    # 应用高斯模糊
    blurred_image = gaussian_filter(image_array, sigma=sigma)

    # 将结果转换回PIL图像
    result_image = Image.fromarray(blurred_image.astype(np.uint8))

    return result_image


# 指定图像路径
image_path = "D:\study pic\child.jpeg"

# 应用高斯模糊
blurred_image = apply_gaussian_blur(image_path)

# 创建一个包含两个子图的网格布局，1 行 2 列，并设置当前子图为第一个
plt.subplot(1, 2, 1)

# 使用matplotlib的imshow函数显示原始图像
# Image.open(image_path) 读取指定路径的图像
# cmap='gray' 指定使用灰度色彩映射来显示图像
plt.imshow(Image.open(image_path), cmap='gray')

# 设置当前子图的标题为 "Original Image"
plt.title('Original Image')

# 关闭当前子图的坐标轴显示
plt.axis('off')

# 创建一个包含两个子图的网格布局，1 行 2 列，并设置当前子图为第二个
plt.subplot(1, 2, 2)

# 使用matplotlib的imshow函数显示经过高斯模糊处理后的图像
# blurred_image 是经过高斯模糊处理后的图像
# cmap='gray' 指定使用灰度色彩映射来显示图像
plt.imshow(blurred_image, cmap='gray')

# 设置当前子图的标题为 "Blurred Image"
plt.title('Blurred Image')

# 关闭当前子图的坐标轴显示
plt.axis('off')

# 显示整个图形窗口，包括所有的子图
plt.show()

双边滤波的基本概念

双边滤波是一种基于像素邻域的滤波方法，它使用两个不同的权重来计算每个像素的新值。这两个权重分别考虑了空间距离和像素值（颜色或亮度）的相似性。

如何工作

选择一个窗口：就像其他滤波方法一样，双边滤波也从选择一个窗口（通常是方形）开始。这个窗口会在图像上逐个像素地移动。
计算空间权重：对于窗口中的每个像素，计算其与中心像素的空间距离，并基于这个距离赋予一个权重。距离中心像素越近的像素获得的权重越高。
计算颜色权重：除了空间距离之外，还会计算窗口内每个像素与中心像素的颜色差异，并基于这种差异赋予另一个权重。颜色越接近的像素获得的权重越高。
结合两种权重：将空间权重和颜色权重结合起来，为每个像素计算一个最终的权重。
计算新像素值：根据每个像素的最终权重，计算出窗口内所有像素的加权平均值，用这个值替换窗口中心像素的原值。
重复以上步骤：继续移动窗口，直到所有像素都被处理过。

双边滤波的特点

边缘保持：由于颜色权重的存在，双边滤波能够较好地保留图像的边缘细节。
去噪能力：空间权重帮助平滑图像，去除噪声。

适用场景

图像平滑：用于减少图像中的噪声，但同时保持边缘清晰。
图像预处理：在执行更复杂的图像处理任务之前，如分割、特征提取等，作为预处理步骤。

实践代码如下：

# 导入必要的库
import cv2
import numpy as np
import matplotlib.pyplot as plt

# 定义一个函数来应用双边滤波
def apply_bilateral_filter(image_path, diameter=9, sigma_color=75, sigma_space=75):
    # 读取图像
    image = cv2.imread(image_path)

    # 将图像从BGR转换为RGB
    # OpenCV默认读取的图像是BGR格式，而matplotlib通常使用RGB格式显示图像
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

    # 应用双边滤波
    # diameter: 窗口直径（窗口大小）
    # sigma_color: 颜色空间的标准差，控制颜色相似性的权重
    # sigma_space: 坐标空间的标准差，控制空间位置相似性的权重
    filtered_image = cv2.bilateralFilter(image_rgb, diameter, sigma_color, sigma_space)

    # 显示原始图像和滤波后的图像
    plt.figure(figsize=(10, 5))

    # 设置第一个子图，显示原始图像
    plt.subplot(1, 2, 1)
    plt.imshow(image_rgb)
    plt.title('Original Image')
    plt.axis('off')

    # 设置第二个子图，显示双边滤波后的图像
    plt.subplot(1, 2, 2)
    plt.imshow(filtered_image)
    plt.title('Bilaterally Filtered Image')
    plt.axis('off')

    # 显示图形
    plt.show()

# 指定图像路径
image_path = "D:\study pic\child.jpeg"

# 调用函数，应用双边滤波
apply_bilateral_filter(image_path)

Premitt算子的基本概念

Premitt算子是一种边缘检测算子，它利用图像中像素值的变化来识别边缘。它通过计算图像中像素值的梯度来确定边缘的位置。

如何工作

选择梯度方向：Premitt算子使用三个不同的方向来计算梯度：水平、垂直和对角线。
计算梯度：对于每个像素，Premitt算子会计算在这些方向上的梯度值。梯度值反映了像素值在这些方向上的变化程度。
确定最大梯度：找到三个方向中最大的梯度值，这通常指示边缘的方向。
阈值处理：应用阈值来确定哪些像素被认为是边缘像素。只有当梯度值超过某个阈值时，才认为该像素属于边缘。
连接边缘：通过连接相邻的边缘像素，形成完整的边缘线。

特点

多方向：Premitt算子使用多个方向来检测边缘，这使得它能够更好地捕捉各种类型的边缘。
简单快速：与其他边缘检测算法相比，Premitt算子相对简单且计算效率较高。
鲁棒性：它对于噪声有一定的抵抗能力，可以在一定程度上减少噪声的影响。

梯度的概念

在图像处理中，梯度表示图像中像素值的变化率。在二维图像中，梯度通常是指图像强度或亮度的变化率。梯度越大，意味着图像中该位置的像素值变化越剧烈，这通常是边缘的标志。

为什么最大梯度值指示边缘方向

最大梯度值：在某个特定像素点，如果在某一方向上的梯度值最大，这意味着图像在该方向上的变化最为明显。
边缘方向：边缘通常与梯度最大的方向垂直。这是因为边缘通常是像素值从一个区域突然变化到另一个区域的地方，这种变化通常沿着梯度最大的方向发生。
例如：一颗树在天空中，从水平方向看，梯度变化很大，因为一边是树一边是天空，那么水平梯度变化大，所以边缘就是在竖直方向

下面是一个使用Python和OpenCV库实现Premitt算子（有时也称为Premitt算子或Premitt边缘检测算子）的示例代码：

# 导入必要的库
import cv2
import numpy as np
import matplotlib.pyplot as plt

# 定义一个函数来应用Premitt算子
def apply_premitt_operator(image_path, threshold=100):
    # 读取图像，以灰度模式读取
    image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

    # 使用Sobel算子计算水平和垂直梯度
    # cv2.CV_64F 表示输出为64位浮点数
    # 1 和 0 分别表示对 x 和 y 方向求导
    # ksize=3 表示使用3x3的卷积核
    sobelx = cv2.Sobel(image, cv2.CV_64F, 1, 0, ksize=3)
    sobely = cv2.Sobel(image, cv2.CV_64F, 0, 1, ksize=3)

    # 计算梯度幅值
    gradient_magnitude = np.sqrt(sobelx**2 + sobely**2)

    # 计算梯度方向
    gradient_direction = np.arctan2(sobely, sobelx)

    # 将梯度方向转换为角度
    gradient_direction_degrees = np.rad2deg(gradient_direction)

    # 应用阈值，只保留梯度幅值大于阈值的像素
    edges = np.zeros_like(gradient_magnitude)
    edges[gradient_magnitude > threshold] = 255

    # 显示原始图像和边缘检测结果
    plt.figure(figsize=(10, 5))

    # 设置第一个子图，显示原始图像
    plt.subplot(1, 2, 1)
    plt.imshow(image, cmap='gray')
    plt.title('Original Image')
    plt.axis('off')

    # 设置第二个子图，显示Premitt算子检测到的边缘
    plt.subplot(1, 2, 2)
    plt.imshow(edges, cmap='gray')
    plt.title('Edges Detected by Premitt Operator')
    plt.axis('off')

    # 显示图形
    plt.show()

# 指定图像路径
image_path = "D:\study pic\child.jpeg"

# 应用Premitt算子
apply_premitt_operator(image_path)

Sobel-Feldman算子

Sobel-Feldman算子是一种经典的边缘检测算子，它使用两个3x3的卷积核来分别计算图像的水平和垂直方向上的梯度。这些梯度可以用来检测图像中的边缘。

工作原理

水平梯度：使用一个3x3的卷积核来计算图像在水平方向上的梯度。
垂直梯度：使用另一个3x3的卷积核来计算图像在垂直方向上的梯度。
梯度幅值：将水平和垂直梯度的平方和的平方根作为最终的梯度幅值，这个值表示边缘的强度。
梯度方向：通过计算水平梯度和垂直梯度之间的角度来确定边缘的方向。

Scharr算子

Scharr算子是一种改进的边缘检测算子，它同样使用两个3x3的卷积核来计算图像的水平和垂直方向上的梯度。与Sobel算子相比，Scharr算子的精度更高，特别是在处理图像边缘时。

工作原理

Scharr算子的工作原理与Sobel算子类似，但它使用了不同的卷积核来计算梯度，这些核在理论上提供了更好的精度。

Laplacian算子

Laplacian算子是一种二阶微分算子，它用于检测图像中的快速变化，特别是边缘。Laplacian算子通过计算图像中像素值的二阶导数来检测边缘。

工作原理

计算二阶导数：Laplacian算子计算图像中像素值的二阶导数，这可以揭示图像中像素值的快速变化。
边缘检测：图像中的边缘通常表现为像素值的急剧变化，因此Laplacian算子可以检测这些边缘。
零交叉点：边缘通常出现在Laplacian算子输出的零交叉点附近，即从正值到负值或从负值到正值的转变。

LoG (Laplacian of Gaussian) 算子

LoG算子是一种结合了高斯平滑和Laplacian算子的边缘检测方法。它首先使用高斯滤波器对图像进行平滑处理，然后计算平滑后的图像的Laplacian。

工作原理

高斯平滑：使用高斯滤波器对图像进行平滑处理，以减少噪声的影响。
计算Laplacian：对平滑后的图像应用Laplacian算子。
边缘检测：LoG算子检测平滑图像中像素值的快速变化，这些变化通常对应于边缘。

优势

减少噪声：通过先进行高斯平滑，LoG算子可以减少噪声的影响。
更精确的边缘检测：LoG算子可以检测到更细的边缘，并且对噪声更不敏感。

使用场景

Laplacian算子：适用于需要快速边缘检测的情况，尤其是在噪声不是主要问题的情况下。
LoG算子：适用于需要更精确边缘检测的情况，尤其是在存在噪声的情况下。

Canny边缘检测的工作原理

Canny边缘检测算法主要包括以下几个步骤：

高斯平滑：首先使用高斯滤波器对图像进行平滑处理，以减少噪声的影响。这一步骤对于减少边缘检测中的假阳性非常重要。
计算梯度：使用Sobel算子或类似的算子来计算图像的水平和垂直梯度，从而得到每个像素的梯度幅值和方向。
非极大值抑制（Non-Maximum Suppression）：在每个像素的梯度方向上进行比较，只保留局部最大值作为边缘候选。这一步骤有助于消除梯度幅值中的非边缘响应，从而得到更清晰的边缘。非极大值抑制（Non-Maximum Suppression）举例说明：假设我们有一个像素点，其梯度方向是45°，我们比较该像素点与其在45°方向上的左右邻居的梯度幅值。

比较：如果该像素点的梯度幅值大于其在45°方向上的左右邻居的梯度幅值，则该像素点被认为是边缘的一部分。

抑制：如果该像素点的梯度幅值小于或等于其在45°方向上的任何一个邻居的梯度幅值，则该像素点被抑制（即不被认为是边缘的一部分）。

4. 双阈值检测（Double Thresholding）：使用两个阈值（高阈值和低阈值）来确定哪些边缘是强边缘，哪些是弱边缘。强边缘被直接标记为边缘，而弱边缘只有在其附近存在强边缘时才会被标记为边缘。

5. 边缘连接：通过跟踪边缘链来连接边缘片段，形成完整的边缘。

Canny边缘检测的步骤详解

高斯平滑：
- 使用高斯滤波器对输入图像进行平滑处理，以减少噪声。
- 选择适当的高斯核大小和标准差（σ）来控制平滑的程度。
计算梯度：
- 使用Sobel算子或其他算子（如Scharr算子）来计算水平和垂直方向上的梯度。
- 计算每个像素的梯度幅值和方向。
非极大值抑制：
- 对每个像素的梯度方向进行量化，通常分为几个方向（如0°、45°、90°和135°）。
- 对每个像素的梯度方向上进行比较，只保留局部最大值。
双阈值检测：
- 选择两个阈值：高阈值用于确定强边缘，低阈值用于确定弱边缘。
- 强边缘是梯度幅值大于高阈值的像素；弱边缘是梯度幅值介于高低阈值之间的像素。
- 如果弱边缘附近有强边缘，则将弱边缘标记为边缘。
边缘连接：
- 通过跟踪边缘链来连接边缘片段，形成连续的边缘。