图像处理-边缘检测算法的原理和实现

概述

边缘检测是图像处理中的一项重要任务,其原理是是检测图像中不连续的灰度级变化,并且确定这些变化的位置和方向。梯度是函数的变化速率,图像中的边缘意味着像素灰度值的快速变化。本文介绍了常用的边缘检测算法有Sobel算子、Prewitt算子、Laplacian算子、Canny算子等,并提供了相关代码。

Sobel算子(滤波器)

Sobel滤波器通过使用两个3x3卷积核(也称为掩模)来计算图像灰度值的水平和垂直梯度。分别称为G_{x}G_{y}

水平梯度核:

G_{x}=\begin{bmatrix} -1 & 0 &1 \\ -2&0 &2 \\ -1&0 &1 \end{bmatrix}

垂直梯度核:

G_{y}=\begin{bmatrix} -1 &-2 &-1 \\ 0 & 0& 0\\ 1&2 &1 \end{bmatrix}

梯度计算:

对于每个像素点I(x,y),应用这些卷积核以获得水平和垂直方向上的梯度值:

G_{x}(x,y)=\sum_{i=-1}^{1}\sum_{j=-1}^{1}I(x+i,y+j)\cdot G_{x}(i+1,j+1)

G_{y}(x,y)=\sum_{i=-1}^{1}\sum_{j=-1}^{1}I(x+i,y+j)\cdot G_{y}(i+1,j+1)

计算梯度幅值:

G=\sqrt{G_{x}+G_{y}}

梯度方向:

\theta =arctan(\frac{G_{y}}{G_{x}})

梯度幅值也可以使用|G_{x}|+|G_{y}|进行近似计算,最后根据设定的阈值进行二值化处理,将梯度幅值大于阈值的点标记为边缘点,否则标记为非边缘点。

Prewitt算子

Prewitt算子与Sobel算子类似,同样是一种基于梯度的算法,但是使用了不同的权重系数。

水平梯度核:

G_{x}=\begin{bmatrix} -1 & 0 &1 \\ -1&0 &1 \\ -1&0 &1 \end{bmatrix}

垂直梯度核:

G_{y}=\begin{bmatrix} -1 &-1 &-1 \\ 0 & 0& 0\\ 1&1 &1 \end{bmatrix}

Laplacian算子

Laplacian(拉普拉斯)算子是一种二阶导数算子,它不再以x和y的方向计算,而是以圆方向计算变化率。因此不需要求梯度幅值。它的卷积核可以表示为:

G=\begin{bmatrix} 0 &1 &0 \\ 1 & -4& 1\\ 0&1 &0 \end{bmatrix}

Canny算子

一阶导数、二阶导数的边缘算子虽然简单易用,但存在一些缺点。例如容易受噪声影响,容易产生虚假边缘。

John F. Canny 在 1986 年提出了 Canny 边缘检测算法。它是结合了梯度计算方法和非极大值抑制技术的一种边缘检测算法。该算法克服了之前的边缘检测算法在抑制噪声和保持边缘信息方面的缺陷,具有较好的性能。

Canny算子的步骤如下:

        噪声抑制:利用高斯滤波器对输入图像进行平滑处理,以减少图像中的噪声。
        梯度计算:通过对平滑后的图像应用Sobel(或Prewitt)算子,计算每个像素点的梯度幅值和方向。
        非极大值抑制:在梯度图像上,对每个像素点在其梯度方向上进行比较,并保留局部最大值点,抑制非边缘像素。
        双阈值检测:根据设定的高阈值和低阈值,将梯度图像中的像素点分为强边缘、弱边缘和非边缘三个部分。
        边缘连接:通过连接强边缘像素和与之相连的弱边缘像素,形成完整的边缘。

Python代码实现

利用OpenCV实现边缘检测的示例代码:

import cv2
import numpy as np
from matplotlib import pyplot as plt

image_color = cv2.imread('lena.png')
image_gray = cv2.imread('lena.png', cv2.IMREAD_GRAYSCALE)

"""------------------------------Sobel-------------------------------------"""
# 使用OpenCV的Sobel函数计算梯度
"""
cv2.Sobel(src, ddepth, dx, dy[, ksize[, scale[, delta[, borderType]]]])  # 参数:
src: 输入图像
ddepth: 输出图像的深度(可以理解为数据类型),-1表示与原图像相同的深度
dx, dy: 当组合为dx = 1, du = 0 时求x方向的一阶导数,当组合为dx = 0, dy = 1 时求y方向的一阶导数(如果同时为1,通常效果不佳)
ksize: (可选参数) Sobel算子的大小,必须是1, 3, 5或者7(奇数), 默认为3。
"""
sobel_x = cv2.Sobel(image_gray, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(image_gray, cv2.CV_64F, 0, 1, ksize=3)
# 计算梯度幅值,图像归一化
sobel_img = np.hypot(sobel_x, sobel_y)
sobel_img = np.uint8(sobel_img / np.max(sobel_img) * 255)

"""------------------------------Prewitt-------------------------------------"""
kernelx = np.array([[1, 1, 1], [0, 0, 0], [-1, -1, -1]], dtype=int)
kernely = np.array([[-1, 0, 1], [-1, 0, 1], [-1, 0, 1]], dtype=int)
prewitt_x = cv2.filter2D(image_gray, -1, kernelx)
prewitt_y = cv2.filter2D(image_gray, -1, kernely)
prewitt_img = np.hypot(prewitt_x, prewitt_y)
prewitt_img = np.uint8(prewitt_img / np.max(prewitt_img) * 255)

"""------------------------------Laplacian-------------------------------------"""
# 使用OpenCV的Laplacian函数
"""
cv2.Laplacian(src, ddepth[, dst[, ksize[, scalel, delta[, borderType]]]]])
参数说明:
src:输入图像,可以是灰度图像,也可以是多通道的彩色图像
ddepth:输出图片的数据深度,由输入图像的深度进行选择
ksize:计算二阶导数滤波器的孔径大小,必须为正奇数,可选项
scale:缩放比例因子,可选项,默认值为 1
delta:输出图像的偏移量,可选项,默认值为 0
"""
lap_img = cv2.Laplacian(image_gray, cv2.CV_64F)
lap_img = cv2.convertScaleAbs(lap_img)

"""------------------------------Canny-------------------------------------"""
# 使用OpenCV的Canny函数
"""
cv.Canny( image, threshold1, threshold2[, apertureSize[, L2gradient]])
image 为输入图像
threshold1 表示处理过程中的第一个阈值。
threshold2 表示处理过程中的第二个阈值。通常高阈值是低阈值的2到3倍。
"""
canny_img = cv2.Canny(image_gray, 100, 200)

image_color_rgb = cv2.cvtColor(image_color, cv2.COLOR_BGR2RGB)
plt.figure(figsize=(10, 7))
plt.subplot(2, 3, 1), plt.title('Original Image'), plt.imshow(image_color_rgb, cmap='gray')
plt.subplot(2, 3, 2), plt.title('Gray Image'), plt.imshow(image_gray, cmap='gray')
plt.subplot(2, 3, 3), plt.title('Sobel'), plt.imshow(sobel_img, cmap='gray')
plt.subplot(2, 3, 4), plt.title('Prewitt'), plt.imshow(prewitt_img, cmap='gray')
plt.subplot(2, 3, 5), plt.title('Laplacian'), plt.imshow(lap_img, cmap='gray')
plt.subplot(2, 3, 6), plt.title('Canny'), plt.imshow(canny_img, cmap='gray')
plt.show()

Matlab代码实现

Matlab中的edge()函数专用于边缘检测,它集成了多种算子,使用非常方便。(ps:若不指定阈值,Matlab将自动计算一个基于图像内容的阈值,也可以在后面多加一个参数作为阈值,如:edge(img_gray, 'canny', [100 200]);)

% 读取一个图像
img = imread('lena.png');  % 你可以改成任何你想要处理的图像
% 转换图像到灰度
img_gray = rgb2gray(img);
% 使用Sobel算子进行边缘检测
sobel_edges = edge(img_gray, 'sobel');
% 使用Prewitt算子进行边缘检测
prewitt_edges = edge(img_gray, 'prewitt');
% 使用Laplacian算子进行边缘检测
laplacian_edges = edge(img_gray, 'log');  % 'log' stands for Laplacian of Gaussian
% 使用Canny算子进行边缘检测
canny_edges = edge(img_gray, 'canny');
% 显示边缘检测结果
figure;
subplot(2, 3, 1); imshow(img); title('Original Image');
subplot(2, 3, 2); imshow(img_gray); title('Gray Image');
subplot(2, 3, 3); imshow(sobel_edges); title('Sobel');
subplot(2, 3, 4); imshow(prewitt_edges); title('Prewitt');
subplot(2, 3, 5); imshow(laplacian_edges); title('Laplacian');
subplot(2, 3, 6); imshow(canny_edges); title('Canny');

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值