通过梯度结构张量进行各向异性图像分割

LLM.

已于 2024-05-05 13:47:17 修改

阅读量2.1k

点赞数 33

文章标签：人工智能 opencv 计算机视觉 webpack

于 2024-02-22 17:00:00 首次发布

本文链接：https://blog.csdn.net/2301_81888214/article/details/136203977

版权

目标

在本教程中，您将学习：

什么是梯度结构张量
如何通过梯度结构张量估计各向异性图像的方向和相干性
如何通过梯度结构张量分割具有单个局部方向的各向异性图像

理论

注意

解释基于[书籍131]，[[27]和 278]。[303]给出了梯度结构张量的良好物理解释。此外，您可以参考维基百科页面结构张量。

此页面上的各向异性图像是真实世界的图像。

什么是梯度结构张量？

在数学中，梯度结构张量（也称为二阶矩矩阵、二阶矩矩张量、惯性张量等）是由函数的梯度推导出来的矩阵。它总结了点的指定邻域中梯度的主要方向，以及这些方向的相干程度（相干性）。梯度结构张量广泛应用于图像处理和计算机视觉的2D/3D图像分割、运动检测、自适应滤波、局部图像特征检测等。

各向异性图像的重要特征包括局部各向异性的方向和相干性。在本文中，我们将展示如何估计方向和相干性，以及如何通过梯度结构张量分割具有单个局部方向的各向异性图像。

图像的梯度结构张量是一个 2x2 对称矩阵。梯度结构张量的特征向量表示局部方向，而特征值表示相干性（各向异性的度量）。

图像 Z 的梯度结构张量可以写成：JZ

在这里插入图片描述

其中 J_{11} = M[Z_{x}^{2}]， J_{22} = M[Z_{y}^{2}]， J_{12} = M[Z_{x}Z_{y}] - 张量的分量， M[] 是数学期望的符号（我们可以将此操作视为窗口 w 中的平均值）， Z_{x} 和 Z_{y} 是图像 Z 相对于 x 和 y 的偏导数。 J11=M[Z2x]J22=M[Z2y]J12=M[ZxZy]M[]ZxZyZxy

在这里插入图片描述

其中 \lambda_1 - 最大特征值，\lambda_2 - 最小特征值。λ1λ2

如何通过梯度结构张量估计各向异性图像的方向和相干性？

各向异性图像的方向：

在这里插入图片描述

一致性：

在这里插入图片描述

一致性范围从 0 到 1。对于理想的局部取向（ \lambda_2 = 0， \lambda_1 > 0）它是 1，对于各向同性的灰度值结构（ \lambda_1 = \lambda_2 > 0 ）它是零。λ2λ1λ1λ2

源代码 C++蟒

您可以在 OpenCV 源代码库中找到源代码。samples/cpp/tutorial_code/ImgProc/anisotropic_image_segmentation/anisotropic_image_segmentation.cpp

#include < iostream>

#include “opencv2/highgui.hpp”

#include“opencv2/imgproc.hpp”

#include“opencv2/imgcodecs.hpp”

使用命名空间 CV;

使用命名空间 std;

void calcGST（const Mat& inputImg， Mat&imgCoherencyOut， Mat&imgOrientationOut， int w）;

int main（）函数

{

intW = 52;窗口大小为 WxW

双C_Thr = 0.43;一致性阈值

int低 Thr = 35;threshold1 表示方向，范围为 0 到 180

int高 Thr = 57;threshold2 表示方向，范围为 0 到 180

示例：：addSamplesDataSearchSubDirectory（“doc/tutorials/imgproc/anisotropic_image_segmentation/images”);

Mat imgIn = imread（samples：：findFile（“gst_input.jpg”）， IMREAD_GRAYSCALE);

如果（imgIn.empty（）） //检查图片是否加载完毕

{

cout << “错误：无法加载图像…！！” << endl;

返回 -1;

}

Mat imgCoherency、imgOrientation;

calcGST（imgIn， imgCoherency， imgOrientation， W）;

垫imgCoherencyBin;

imgCoherencyBin = img相干性> C_Thr;

Mat imgOrientationBin;

inRange（imgOrientation， Scalar（LowThr）， Scalar（HighThr）， imgOrientationBin）;

Mat imgBin;

imgBin = imgCoherencyBin & imgOrientationBin;

归一化（imgCoherency， imgCoherency， 0， 255， NORM_MINMAX， CV_8U);

normalize（imgOrientation， imgOrientation， 0， 255， NORM_MINMAX， CV_8U);

imshow（“原始”， imgIn）;

imshow（“结果”， 0.5 * （imgIn + imgBin））;

imshow（“连贯性”， img连贯性）;

imshow（“方向”， imgOrientation）;

imwrite（“结果.jpg”， 0.5*（imgIn + imgBin））;

imwrite（“连贯性.jpg”， img连贯性）;

imwrite（“方向.jpg”， imgOrientation）;

waitKey（0）;

返回 0;

}

void calcGST（const Mat& inputImg， Mat&imgCoherencyOut， Mat&imgOrientationOut， int w）

{

垫子img;

输入Img。convertTo（img， CV_32F);

GST组成部分计算（开始）

J = (J11 J12;J12 J22） - 消费税

Mat imgDiffX、imgDiffY、imgDiffXY;

索贝尔（img， imgDiffX， CV_32F， 1， 0， 3）;

索贝尔（img， imgDiffY， CV_32F， 0， 1， 3）;

乘法（imgDiffX， imgDiffY， imgDiffXY）;

Mat imgDiffXX， imgDiffYY;

乘法（imgDiffX， imgDiffX， imgDiffXX）;

乘法（imgDiffY， imgDiffY， imgDiffYY）;

席J11、J22、J12;J11、J22 和 J12 是 GST 组件

boxFilter（imgDiffXX， J11， CV_32F， Size（w， w））;

boxFilter（imgDiffYY， J22， CV_32F， Size（w， w））;

boxFilter（imgDiffXY， J12， CV_32F， Size（w， w））;

GST组成部分计算（停止）

特征值计算（START）

lambda1 = 0.5*（J11 + J22 + sqrt（（J11-J22）^2 + 4*J12^2））

lambda2 = 0.5*（J11 + J22 - sqrt（（J11-J22）^2 + 4*J12^2））

垫子 tmp1、tmp2、tmp3、tmp4;

tmp1 = J11 + J22;

tmp2 = J11 - J22;

乘法（tmp2， tmp2， tmp2）;

乘法（J12， J12， tmp3）;

平方（TMP2 + 4.0 * TMP3， TMP4）;

垫 lambda1、lambda2;

lambda1 = TMP1 + TMP4;

lambda1 = 0.5*lambda1;最大特征值 //

lambda2 = TMP1 - TMP4;

lambda2 = 0.5*lambda2;最小特征值

特征值计算（停止）

相干性计算（开始）

Coherency = （lambda1 - lambda2）/（lambda1 + lambda2）） - 各向异性的测量

相干性是各向异性程度（局部取向的一致性）

divide（lambda1 - lambda2， lambda1 + lambda2， imgCoherencyOut）;

相干性计算（停止）

方向角计算（START）

tan（2阿尔法） = 2J12/（J22 - J11）

阿尔法 = 0.5 atan2（2*J12/（J22 - J11））

相位（J22 - J11， 2.0*J12， imgOrientationOut， true);

imgOrientationOut = 0.5*imgOrientationOut;

方向角计算（停止）

}

解释 C++蟒

各向异性图像分割算法由梯度结构张量计算、方向计算、相干性计算以及方向和相干度阈值组成：

Mat imgCoherency、imgOrientation;

calcGST（imgIn， imgCoherency， imgOrientation， W）;

垫imgCoherencyBin;

imgCoherencyBin = img相干性> C_Thr;

Mat imgOrientationBin;

inRange（imgOrientation， Scalar（LowThr）， Scalar（HighThr）， imgOrientationBin）;

Mat imgBin;

imgBin = imgCoherencyBin & imgOrientationBin;

函数 calcGST（）使用梯度结构张量计算方向和连贯性。输入参数 w 定义窗口大小：

void calcGST（const Mat& inputImg， Mat&imgCoherencyOut， Mat&imgOrientationOut， int w）

{

垫子img;

输入Img。convertTo（img， CV_32F);

GST组成部分计算（开始）

J = (J11 J12;J12 J22） - 消费税

Mat imgDiffX、imgDiffY、imgDiffXY;

索贝尔（img， imgDiffX， CV_32F， 1， 0， 3）;

索贝尔（img， imgDiffY， CV_32F， 0， 1， 3）;

乘法（imgDiffX， imgDiffY， imgDiffXY）;

Mat imgDiffXX， imgDiffYY;

乘法（imgDiffX， imgDiffX， imgDiffXX）;

乘法（imgDiffY， imgDiffY， imgDiffYY）;

垫子 J11、J22、J12;J11、J22 和 J12 是 GST 组件

boxFilter（imgDiffXX， J11， CV_32F， Size（w， w））;

boxFilter（imgDiffYY， J22， CV_32F， Size（w， w））;

boxFilter（imgDiffXY， J12， CV_32F， Size（w， w））;

GST组成部分计算（停止）

特征值计算（START）

lambda1 = 0.5*（J11 + J22 + sqrt（（J11-J22）^2 + 4*J12^2））

lambda2 = 0.5*（J11 + J22 - sqrt（（J11-J22）^2 + 4*J12^2））

垫子 tmp1、tmp2、tmp3、tmp4;

tmp1 = J11 + J22;

tmp2 = J11 - J22;

乘法（tmp2， tmp2， tmp2）;

乘法（J12， J12， tmp3）;

平方（TMP2 + 4.0 * TMP3， TMP4）;

垫 lambda1、lambda2;

lambda1 = TMP1 + TMP4;

lambda1 = 0.5*lambda1;最大特征值 //

lambda2 = TMP1 - TMP4;

lambda2 = 0.5*lambda2;最小特征值

特征值计算（停止）

相干性计算（开始）

Coherency = （lambda1 - lambda2）/（lambda1 + lambda2）） - 各向异性的测量

相干性是各向异性程度（局部取向的一致性）

divide（lambda1 - lambda2， lambda1 + lambda2， imgCoherencyOut）;

相干性计算（停止）

方向角计算（START）

tan（2阿尔法） = 2J12/（J22 - J11）

阿尔法 = 0.5 atan2（2*J12/（J22 - J11））

相位（J22 - J11， 2.0*J12， imgOrientationOut， true);

imgOrientationOut = 0.5*imgOrientationOut;

方向角计算（停止）

}

下面的代码将阈值 LowThr 和 HighThr 应用于图像方向，并将阈值C_Thr应用于由上一个函数计算的图像相干性。LowThr 和 HighThr 定义方向范围：

垫imgCoherencyBin;

imgCoherencyBin = img相干性> C_Thr;

Mat imgOrientationBin;

inRange（imgOrientation， Scalar（LowThr）， Scalar（HighThr）， imgOrientationBin）;

最后，我们结合阈值结果：

Mat imgBin;

imgBin = imgCoherencyBin & imgOrientationBin;

结果

下面您可以看到单向的真实各向异性图像：

单向各向异性图像

下面您可以看到各向异性图像的方向和相干性：

取向

一致性

您可以在下面看到细分结果：

细分结果

结果是用 w = 52、C_Thr = 0.43、LowThr = 35、HighThr = 57 计算得出的。我们可以看到，该算法只选择了具有单一方向的区域

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

在这里插入图片描述