一.什么是canny边缘检测算子
Canny边缘检测算子是John F. Canny于1986年开发出来的一个多级边缘检测算法。
二.步骤
降噪:任何边缘检测算法都不可能在未经处理的原始数据上很好地处理,所以第一步是对原始数据与高斯平滑模板作卷积,得到的图像与原始图像相比有些轻微的模糊(blurred)。这样,单独的一个像素噪声在经过高斯平滑的图像上变得几乎没有影响。
寻找梯度:图像中的边缘可能会指向不同的方向,所以Canny算法使用4个mask检测水平、垂直以及对角线方向的边缘。原始图像与每个mask所作的卷积都存储起来。对于每个点我们都标识在这个点上的最大值以及生成的边缘的方向。这样我们就从原始图像生成了图像中每个点亮度梯度图以及亮度梯度的方向。
跟踪边缘:较高的亮度梯度比较有可能是边缘,但是没有一个确切的值来限定多大的亮度梯度是边缘多大又不是,所以Canny使用了滞后阈值。
三.参数
-
高斯滤波器的大小:第一步所用的平滑滤波器将会直接影响Canny算法的结果。较小的滤波器产生的模糊效果也较少,这样就可以检测较小、变化明显的细线。较大的滤波器产生的模糊效果也较多,将较大的一块图像区域涂成一个特定点的颜色值。这样带来的结果就是对于检测较大、平滑的边缘更加有用,例如彩虹的边缘。
-
阈值:使用两个阈值比使用一个阈值更加灵活,但是它还是有阈值存在的共性问题。设置的阈值过高,可能会漏掉重要信息;阈值过低,将会把枝节信息看得很重要。很难给出一个适用于所有图像的通用阈值。目前还没有一个经过验证的实现方法。
四.实验代码
只需修改为自己的图像:
import math
import numpy as np
import matplotlib.pyplot as plt
def gaussian_create():
sigma1 = sigma2 = 1
gaussian_sum = 0
g = np.zeros([3, 3])
for i in range(3):
for j in range(3):
g[i, j] = math.exp(-1 / 2 * (np.square(i - 1) / np.square(sigma1)
+ (np.square(j - 1) / np.square(sigma2)))) / (
2 * math.pi * sigma1 * sigma2)
gaussian_sum = gaussian_sum + g[i, j]
g = g / gaussian_sum
return g
def gray_fuc(rgb):
return np.dot(rgb[..., :3], [0.299, 0.587, 0.114])
def gaussian_blur(gray_img, g):
gray_img = np.pad(gray_img, ((1, 1), (1, 1)), constant_values=0) # 填充
h, w = gray_img.shape
new_gray_img = np.zeros([h - 2, w - 2])
for i in range(h - 2):
for j in range(w - 2):
new_gray_img[i, j] = np.sum(gray_img[i:i + 3, j:j + 3] * g)
return new_gray_img
def partial_derivative(new_gray_img):
new_gray_img = np.pad(new_gray_img, ((0, 1), (0, 1)), constant_values=0) # 填充
h, w = new_gray_img.shape
dx_gray = np.zeros([h - 1, w - 1])
dy_gray = np.zeros([h - 1, w - 1])
df_gray = np.zeros([h - 1, w - 1])
for i in range(h - 1):
for j in range(w - 1):
dx_gray[i, j] = new_gray_img[i, j + 1] - new_gray_img[i, j]
dy_gray[i, j] = new_gray_img[i + 1, j] - new_gray_img[i, j]
df_gray[i, j] = np.sqrt(np.square(dx_gray[i, j]) + np.square(dy_gray[i, j]))
return dx_gray, dy_gray, df_gray
def non_maximum_suppression(dx_gray, dy_gray, df_gray):
df_gray = np.pad(df_gray, ((1, 1), (1, 1)), constant_values=0) # 填充
h, w = df_gray.shape
for i in range(1, h - 1):
for j in range(1, w - 1):
if df_gray[i, j] != 0:
gx = math.fabs(dx_gray[i - 1, j - 1])
gy = math.fabs(dy_gray[i - 1, j - 1])
if gx > gy:
weight = gy / gx
grad1 = df_gray[i + 1, j]
grad2 = df_gray[i - 1, j]
if gx * gy > 0:
grad3 = df_gray[i + 1, j + 1]
grad4 = df_gray[i - 1, j - 1]
else:
grad3 = df_gray[i + 1, j - 1]
grad4 = df_gray[i - 1, j + 1]
else:
weight = gx / gy
grad1 = df_gray[i, j + 1]
grad2 = df_gray[i, j - 1]
if gx * gy > 0:
grad3 = df_gray[i + 1, j + 1]
grad4 = df_gray[i - 1, j - 1]
else:
grad3 = df_gray[i + 1, j - 1]
grad4 = df_gray[i - 1, j + 1]
t1 = weight * grad1 + (1 - weight) * grad3
t2 = weight * grad2 + (1 - weight) * grad4
if df_gray[i, j] > t1 and df_gray[i, j] > t2:
df_gray[i, j] = df_gray[i, j]
else:
df_gray[i, j] = 0
return df_gray
def double_threshold(df_gray, low, high):
h, w = df_gray.shape
for i in range(1, h - 1):
for j in range(1, w - 1):
if df_gray[i, j] < low:
df_gray[i, j] = 0
elif df_gray[i, j] > high:
df_gray[i, j] = 1
elif (df_gray[i, j - 1] > high) or (df_gray[i - 1, j - 1] > high) or (
df_gray[i + 1, j - 1] > high) or (df_gray[i - 1, j] > high) or (df_gray[i + 1, j] > high) or (
df_gray[i - 1, j + 1] > high) or (df_gray[i, j + 1] > high) or (df_gray[i + 1, j + 1] > high):
df_gray[i, j] = 1
else:
df_gray[i, j] = 0
return df_gray
if __name__ == '__main__':
# 读取图像
img = plt.imread(r"C:\Users\12302\Desktop\text3\demo_one\photo1.jpg")
gaussian = gaussian_create()
gray = gray_fuc(img)
new_gray = gaussian_blur(gray, gaussian)
d = partial_derivative(new_gray)
dx = d[0]
dy = d[1]
df = d[2]
new_df = non_maximum_suppression(dx, dy, df)
low_threshold = 0.15 * np.max(new_df)
high_threshold = 0.2 * np.max(new_df)
result = double_threshold(new_df, low_threshold, high_threshold)
plt.imshow(result, cmap="gray")
plt.axis("off")
plt.show()
使用前:
使用后:
本文参考: