PythonCV学习记录6——图片的信息处理

目录

一.图像的梯度

1.梯度的介绍

2.常用的梯度算法

①Sobel 算子和 Scharr 算子

②Laplacian 算子

③注意

二.Canny边缘检测

1.过程简述

①噪声去除

②计算梯度

③非最大值抑制——把边界边薄

④滞后阀值——去除非边界

2.代码


一.图像的梯度

1.梯度的介绍

对于梯度,最开始看着看着我就自闭了,这是什么玩意儿。后来看了许多文章,发现梯度就是求导,甚至简单一点来说,就是作差。差的结果就是新的像素点的值(我以为求出导了还有什么复杂的运算,是我想多了)

假设把一个图当做一个二元函数的话,它的颜色值可以假设作为一个由X,Y决定的函数。那么,我们对其求导就是其梯度。但是在数据处理方面,这是一个不连续的函数,X=1,2,3……所以,我们只能有差分的方法求导。求一个一元的函数的导就像这样{Fx}' = \frac{Fx\left ( X+1\right )-Fx\left ( X \right )}{1}

二元函数求导有二元函数的公式,转换成代码的差分函数。我不做详细的描述。这有一篇大佬的文章,是分析数学的:

https://blog.csdn.net/b5w2p0/article/details/9294503

然后说呢,比如我们只求图片X方向上的梯度,那么也就是说:对于\begin{bmatrix} a&b &c \\ d&e& f\\ g&h & i \end{bmatrix}这个图片(矩阵),我们的有一个这样的算子\begin{bmatrix} -1& 0 &1 \end{bmatrix}

那么们代给e的话就是e'=f-d。然后这个e'就是在该算子下的值,然后这个值就是新图片的一部分。然后一直循环运算,就可以得到一个图的梯度图。所以,算子不同,梯度图的效果就不同,比如这样的拉普拉斯算子\begin{bmatrix} 0 &1 &0 \\ 1& -4& 1\\ 0&1 &0 \end{bmatrix}

梯度的方向一般总是与边界垂直。梯度方向被归为四类:垂直,水平,和两个对角线。

看看梯度图的效果叭:

2.常用的梯度算法

①Sobel 算子和 Scharr 算子

Sobel 算子是高斯平滑与微分操作的结合体,所以它的抗噪声能力很好。你可以设定求导的方向(xorder 或 yorder)。还可以设定使用的卷积核的大小(ksize)。如果 ksize=-1,会使用 3x3 的 Scharr 滤波器,它的的效果要比 3x3 的 Sobel 滤波器好(而且速度相同,所以在使用 3x3 滤波器时应该尽量使用 Scharr 滤波器)。3x3 的 Scharr 滤波器卷积核如下:

sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=5)
sobely = cv2.Sobel(img,cv2.CV_64F,0,1,ksize=5)

②Laplacian 算子

拉普拉斯算子可以使用二阶导数的形式定义,可假设其离散实现类似于二阶 Sobel 导数,事实上,OpenCV 在计算拉普拉斯算子时直接调用 Sobel 算子。计算公式如下:

拉普拉斯滤波器使用的卷积核:\begin{bmatrix} 0 &1 &0 \\ 1& -4& 1\\ 0&1 &0 \end{bmatrix}

laplacian = cv2.Laplacian(img,cv2.CV_64F)

③注意

在查看上面这个例子的注释时不知道你有没有注意到:当我们可以通过参数 -1 来设定输出图像的深度(数据类型)与原图像保持一致,但是我们在代码中使用的却是 cv2.CV_64F。这是为什么呢?想象一下一个从黑到白的边界的导数是整数,而一个从白到黑的边界点导数却是负数。如果原图像的深度是np.int8 时,所有的负值都会被截断变成 0,换句话说就是把把边界丢失掉。所以如果这两种边界你都想检测到,最好的的办法就是将输出的数据类型设置的更高,比如 cv2.CV_16S,cv2.CV_64F 等。取绝对值然后再把它转回到 cv2.CV_8U。

二.Canny边缘检测

1.过程简述

①噪声去除

由于边缘检测很容易受到噪声影响,所以第一步是使用 5x5 的高斯滤波器去除噪声。

②计算梯度

对平滑后的图像使用 Sobel 算子计算水平方向和竖直方向的一阶导数(图像梯度)(Gx 和 Gy)。根据得到的这两幅梯度图(Gx 和 Gy)找到边界的梯度和方向,公式如下:

③非最大值抑制——把边界边薄

其含义为,因为边界嘛,所以因该很薄,所以只用取我们取出来的的梯度图中的最大的一个点。比如下图,CAB三个点中,如果A最大,那么说明它的变化最明显,更像边界,所以我们选A为边界点。现在你得到的是一个包含“窄边界”的二值图像

④滞后阀值——去除非边界

由上图我们可以看到,我们给一个maxval,minval两个值作为边界的判定区域,如果高于maxval那么就是边界,低于minval就不是边界。在maxval与minval之间的区域,我称之为“待定区域”,这个区域用于检测是否与边界相连,从而判定为是否为边界,比如C点与A相连,C就是边界。B独立,那么就不为边界。

所以选择合适的 maxVal和 minVal 对于能否得到好的结果非常重要。在这一步一些小的噪声点也会被除去,因为我们假设边界都是一些长的线段。

2.代码

原理都基本上相同,程序员也很懒,所以直接封装。因此得到cv2.Canny()

这个函数的第一个参数是输入图像。

第二和第三个分别是 minVal 和 maxVal。

第四个参数设置用来计算图像梯度的 Sobel卷积核的大小,默认值为 3。

最后一个参数是 L2gradient,它可以用来设定求梯度大小的方程。如果设为 True,就会使用我们上面提到过的方程,否则使用方程: 代替,默认值为 False。

所以最简化的代码是:

edges = cv2.Canny(img,100,200)

效果:

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

康娜喵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值