图像梯度(opencv-c++)

最新推荐文章于 2024-07-17 10:14:26 发布

H-w-H

最新推荐文章于 2024-07-17 10:14:26 发布

阅读量1.5k

点赞数

分类专栏： opencv 文章标签： opencv c++ 计算机视觉

本文链接：https://blog.csdn.net/weixin_45363113/article/details/126079677

版权

opencv 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

图像梯度

图像梯度

梯度

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）

设二元函数 $z = f (x, y)$ 在平面区域D上具有一阶连续偏导数，则对于每一个点P（x，y）都可定出一个向量

$\{\frac {\partial f}{\partial x},\frac {\partial f}{\partial x}\}=f_x(x,y)\bar i+f_y(x,y)\bar j$ ，该函数就称为函数 $z = f (x, y)$ 在点P（x，y）的梯度，记作gradf（x，y）或 $\triangledown f(x,y)$

$gradf(x,y)=\triangledown f(x,y)=\{\frac {\partial f}{\partial x},\frac {\partial f}{\partial x}\}=f_x(x,y)\bar i+f_y(x,y)\bar j$
其中 $\triangledown =\frac {\partial }{\partial x}\bar i+\frac {\partial }{\partial x}\bar j$ 称为（二维的）向量微分算子或Nabla算子

视频讲解

图像梯度推导

在微积分中，一维函数的一阶微分的基本定义是这样的：
$\frac {df}{dx} = \lim_{\epsilon\rightarrow0}\frac {f(x+\epsilon)-f(x)}{\epsilon}$
而图像是一个二维函数f(x,y)，其微分当然就是偏微分。因此有：
$\frac {\partial f(x,y)}{\partial x} = \lim_{\epsilon\rightarrow0}\frac {f(x+\epsilon, y)-f(x, y)}{\epsilon}\\ \frac {\partial f(x,y)}{\partial y} = \lim_{\epsilon\rightarrow0}\frac {f(x, y+\epsilon)-f(x, y)}{\epsilon}$
因为图像是一个离散的二维函数， $\epsilon$ 不能无限小，我们的图像是按照像素来离散的，最小的 $\epsilon$ 就是1像素。因此，上面的图像微分又变成了如下的形式（ $\epsilon=1$ ）：
$\frac {\partial f(x,y)}{\partial x} = f(x+1,y)-f(x,y)=gx\\ \frac {\partial f(x,y)}{\partial y} = f(x,y+1)-f(x,y)=gy$
这分别是图像在(x, y)点处x方向和y方向上的梯度，从上面的表达式可以看出来，图像的梯度相当于2个相邻像素之间的差值。

梯度算法（opencv）

梯度简单来说就是求导。OpenCV 提供了三种不同的梯度滤波器，或者说高通滤波器： $S o b e l$ ， $S c ha rr$ 和 $L a pl a c ian 。$ 什么叫高通呢？其实就是和图像模糊相反。图像模糊是让低频通过，阻挡高频，这样就可以去除噪点，让锐利的边缘变平滑。高通滤波器就是让高频通过，阻挡低频，可以让边缘更加明显，增强图像。

Sobel算子

$G_x = \begin{bmatrix} -1 & 0 & +1 \\ -2 & 0 & +2 \\ -1 & 0 & +1 \end{bmatrix}*A \qquad and \qquad G_y = \begin{bmatrix}-1 & -2 & -1 \\ 0 & 0 & 0 \\ +1 & +2 & +1\end{bmatrix}*A$

$S o b e l$ 算子是高斯平滑和微分操作的结合体，所以他的抗噪声能力很好。该算子利用局部差分寻找边缘，计算所得的是一个梯度的近似值。可以设定求导的方向（ $X$ 或 $Y$ ）。还可以设定使用的卷积核大小（ $k s i ze$ ）。当 $k s i ze = - 1$ 时，会使用 $3 x 3$ 的 $S c ha rr$ 滤波器，他的效果要比 $3 x 3$ 的 $S o b e l$ 滤波器好，而且速度相同，所以在使用 $3 x 3$ 滤波器时应该尽量使用 $S c ha rr$ 滤波器（一般就用 $S o b e l$ 算子即可）。

前一个 $S o b e l$ 矩阵与原始图像A进行卷积操作后得到的是右边的像素值减去左边的像素值；后一个 $S o b e l$ 矩阵与原始图像A进行卷积操作后得到的是下边的像素值减去上边的像素值。

$o p e n c v （ c + + ）中的定义$
void Sobel(cv::InputArray src, cv::OutputArray dst, int ddepth, int dx, int dy, int ksize = 3, double scale = (1.0), double delta = (0.0), int borderType = 4)

Scharr算子

$G_x = \begin{bmatrix} -3 & 0 & +3 \\ -10 & 0 & +10 \\ -3 & 0 & +3 \end{bmatrix}*A \qquad and \qquad G_y = \begin{bmatrix}-3 & -10 & -3 \\ 0 & 0 & 0 \\ +3 & +10 & +3\end{bmatrix}*A$

其实就是将 $S o b e l$ 算子的数增大了，这样对边缘的检测更敏感。

$o p e n c v （ c + + ）$ 中的定义
void Scharr(cv::InputArray src, cv::OutputArray dst, int ddepth, int dx, int dy, double scale = (1.0), double delta = (0.0), int borderType = 4)

Laplacian 算子

拉普拉斯算子：拉普拉斯算子（Laplace Operator）是n维欧几里德空间中的一个二阶微分算子，定义为梯度（▽f）的散度（▽·f）
$\vartriangle f = \triangledown^2 f=\triangledown . \triangledown f=\sum_{i=1}^n \frac {\partial^2 f}{\partial x^2_i}$

在图像中

$L a pl a c ian$ （拉普拉斯）算子是一种二阶导数算子，其具有旋转不变性，可以满足不同方向的图像边缘锐化（边缘检测）的要求。通常情况下，其算子的系数之和需要为零。

$o p e n c v （ c + + ）$ 中的定义
void cv::Laplacian(cv::InputArray src, cv::OutputArray dst, int ddepth, int ksize = 1, double scale = (1.0), double delta = (0.0), int borderType = 4)

H-w-H

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
图像梯度(opencv-c++)

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）（拉普拉斯）算子是一种二阶导数算子，其具有旋转不变性，可以满足不同方向的图像边缘锐化（边缘检测）的要求。拉普拉斯算子（LaplaceOperator）是n维欧几里德空间中的一个二阶微分算子，定义为梯度（▽f）的散度（▽·f）这分别是图像在(x,y)点处x方向和y方向上的梯度，从上面的表达式可以看出来，图像的梯度相当于2个相邻像素之间的差值。...
复制链接

扫一扫