opencv---分水岭操作

最新推荐文章于 2024-07-27 12:20:46 发布

HelloFuckingWorld

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量397

点赞数

分类专栏： Opencv 文章标签： python opencv 计算机视觉

本文链接：https://blog.csdn.net/Forest_2Cat/article/details/105531514

版权

Opencv 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

分水岭操作的原理及实现

分水岭操作的原理：
把图像看成是山峰与山谷的交汇。山峰就是转化成灰度图后数值大的地方，山谷就是转化成灰度图后数值小的地方。在每个山谷以不同颜色的水从下至上注入进来，水位线在每个山谷慢慢上移，最终不同颜色的水会交接，交接处就是我们要找的分水岭。

分水岭操作的实现，以及一些关键的解释都在代码块中：

# 分水岭操作:
# 流程：输入图像--->灰度--->二值化--->距离变换--->寻找种子--->生成Marker--->分水岭变换--->输出图像--->End

#   （一）获取灰度图像，二值化图像，进行形态学操作，消除噪点
#   （二）在距离变换前加上一步操作：通过对上面形态学去噪点后的图像，进行膨胀操作，可以得到大部分都是背景的区域（原黑色不是我们需要的部分是背景）
#   
#   （三）使用距离变换distanceTransform获取确定的前景色
# 相关知识补充（重点）
#   （四）在获取了背景区域和前景区域（其实前景区域是我们的种子，我们将从这里进行灌水，向四周涨水，但是这个需要在markers中表示）后，这两个区域中有未重合部分（注1）怎么办？首先确定这些区域（寻找种子）
#    开始获取未知区域unknown（栅栏会创建在这一区域），为下一步获取种子做准备
#    （五）获取了这些区域，我们可以获取种子，这是通过connectedComponents实现,获取masker标签，确定的前景区域会在其中显示为以1开始的数据，这就是我们的种子，会从这里开始漫水
#   重点：
#   （六）根据未知区域unknown在markers中设置栅栏，并将背景区域加入种子区域，一起漫水
#   （七）根据种子开始漫水，让水漫起来找到最后的漫出点（栅栏边界），越过这个点后各个山谷中水开始合并。注意watershed会将找到的栅栏在markers中设置为-1
import cv2 as cv
import numpy as np


def watershed_demo():
    src = cv.imread("D:/pythonprograms/tutorial1/images/detect_circle_demo.png")
    cv.imshow("input image", src)
    print(src.shape)
    blurred = cv.pyrMeanShiftFiltering(src, 10, 100)  # 去噪
    # 灰度，二值化
    gray = cv.cvtColor(blurred, cv.COLOR_BGR2GRAY)
    ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY | cv.THRESH_OTSU)
    cv.imshow("binary_image", binary)

    # 形态学操作,进一步消除噪点
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (3, 3))
    mb = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel, iterations=2)  # 连续两次开操作，消除图像的噪点
    # 在距离变换前加上一步操作：通过对上面形态学去噪点后的图像，进行膨胀操作，可以得到大部分都是背景的区域（原黑色不是我们需要的部分是背景）
    sure_bg = cv.dilate(mb, kernel, iterations=3)  # 3次膨胀,可以获取到大部分都是背景的区域

    cv.imshow("mor-opt", sure_bg)

    # 距离:使用距离变换distanceTransform获取确定的前景色:主要用于计算非零像素到最近零像素点的最短距离。一般用于求解图像的骨骼
    # 根据distanceTransform获取距离背景最小距离的结果

    # 距离变换的处理图像通常都是二值图像，而二值图像其实就是把图像分为两部分，即背景和物体两部分，物体通常又称为前景目标！
    # 通常我们把前景目标的灰度值设为255，即白色
    # 背景的灰度值设为0，即黑色。
    # 所以定义中的非零像素点即为前景目标，零像素点即为背景。
    # 所以图像中前景目标中的像素点距离背景越远，那么距离就越大，如果我们用这个距离值替换像素值，那么新生成的图像中这个点越亮。
    # 再通过设定合理的阈值对距离变换后的图像进行二值化处理，则可得到去除手指的图像(如下图“bidist”窗口图像所示)，手掌重心即为该图像的几何中心。

    # def distanceTransform(src, distanceType, maskSize, dst=None,
    #                       dstType=None)
    # src：输入的图像，一般为二值图像
    # distanceType：所用的求解距离的类型，有CV_DIST_L1, CV_DIST_L2, or CV_DIST_C
    # mask_size：距离变换掩模的大小，可以是3或5.对CV_DIST_L1或CV_DIST_C的情况，参数值被强制设定为3, 因为3×3mask给出5×5mask一样的结果，而且速度还更快。
    dist = cv.distanceTransform(mb, cv.DIST_L2, 3)  ##这是我们获取的字段距离数值，对应每个像素都有，所以数组结构和图像数组一致

    # 若是想骨骼显示（对我们的分水岭流程无影响），我们需要对distanceTransform返回的结果进行归一化处理，使用normalize
    #  在整数表示的颜色空间中，数值范围是0 - 255，但在浮点数表示的颜色空间中，数值范围是0 - 1.0，所以要把0 - 255归一化。
    #  顺便补充：若是不做归一化处理，数值大于1的都会变为1.0处理
    dist_output = cv.normalize(dist, 0, 1.0, cv.NORM_MINMAX)  # 归一化的距离图像数组
    cv.imshow("distance-t", dist_output * 50)  # *50增加亮度，以便能显示出来

    # 根据distanceTransform操作的结果，设置一个阈值，使用threshold决定哪些区域是前景，这样得到正确结果的概率很高
    # 这里是求取硬币偏白色，使用THRESH_BINARY，所以我们获取对象是白色区域，是获取未重合部分
    # 若是我们求取树叶等偏黑，需要使用THRESH_BINARY_INV，此时我们获取的对象是黑色区域，就变为了获取重合部分了
    ret, surface = cv.threshold(dist, dist.max() * 0.6, 255, cv.THRESH_BINARY)  # 获取前景色
    cv.imshow("surface-bin", surface)

    # marker
    surface_fg = np.uint8(surface)  ##保持色彩空间一致才能进行运算，现在是背景空间为整型空间，前景为浮点型空间，所以进行转换
    unknow = cv.subtract(sure_bg, surface_fg)
    cv.imshow("unknow",unknow)

    # 获取了这些区域，我们可以获取种子，这是通过connectedComponents实现, 获取masker标签，确定的前景区域会在其中显示为以1开始的数据，这就是我们的种子，会从这里开始漫水
    # 现在知道了那些是背景那些是硬币（确定的前景区域）了。
    # 那我们就可以创建标签（一个与原图像大小相同，数据类型为in32的数组），并标记其中的区域了。
    # 对我们已经确定分类的区域（无论是前景还是背景）使用不同的正整数标记，对我们不确定的区域（unknown区域）使用0标记。我们可以使用函数cv2.connectedComponents()来做这件事。
    # 它会把对标签进行操作，将背景标记为0，其他的对象使用从1开始的正整数标记（其实这就是我们的种子，水漫时会从这里漫出）。然后将这个标签返回给我们markers
    # 但是，我们知道如果背景标记为0，那分水岭算法就会把它当成未知区域了。（我们要将未知区域标记为0，所以我们要将背景区域变为其他整数，例如 + 1）
    # 所以我们想使用不同的整数标记它们。
    # 而对不确定的区域（函数cv2.connectedComponents输出的结果中使用unknown定义未知区域）标记为0。

    # 参数image是需要进行连通域处理的二值图像，其他的这里用不到
    # ret是连通域处理的边缘条数，是上面提到的确定区域（出去背景外的其他确定区域：就是前景），就是种子数，我们会从种子开始向外涨水
    # markers是我们创建的一个标签（一个与原图像大小相同，数据类型为in32的数组），其中包含有我们原图像的确认区域的数据（前景区域）
    # 返回值是标签总数，输出的是标记图像，所谓标记图像就是图像中每一个连通域都拥有一个标签（背景的标签是0），该标签即代表了此连通域的灰度值。例如，一幅图像中存在3个连通域（背景除外），那么他们的标签分别是1、2、3，他们的灰度值分别是1、2、3。
    ret, markers = cv.connectedComponents(surface_fg)
    print(ret)

    # 分水岭变换:
    # watershed漫水算法需要我们将栅栏区域设置为0，所以我们需要将markers中背景区域（原来为0，会干扰算法）设置为其他整数。
    # 解决方法将markers整体加一　　  # 此时种子区域不止我们原来的前景区域，又增加了一个背景区域，我们将从这些区域一起灌水
    markers = markers + 1
    markers[unknow == 255] = 0

    # 根据种子开始漫水，让水漫起来找到最后的漫出点（栅栏边界），越过这个点后各个山谷中水开始合并。注意watershed会将找到的栅栏在markers中设置为 - 1
    markers = cv.watershed(src, markers=markers)      #获取栅栏
    src[markers == -1] = [0, 0, 255]                  #根据栅栏，我们对原图像进行操作，对栅栏区域设置为红色
    cv.imshow("result", src)


print("------Hello Opencv-----")
# src=cv.imread("D:/pythonprograms/tutorial1/images/demo.png")
# cv.namedWindow("This is a image",cv.WINDOW_AUTOSIZE)
watershed_demo()
cv.waitKey(0)
cv.destroyAllWindows()

运行结果：
输入图像在这里插入图片描述

代码是跟着贾志刚讲师敲的，注释参考了很多人的文章，也加了自己的理解，下面贴一个我觉得目前找到的最好的注释版本。
https://www.cnblogs.com/ssyfj/p/9278815.html

HelloFuckingWorld

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
opencv---分水岭操作

分水岭操作的原理及实现分水岭操作的原理：把图像看成是山峰与山谷的交汇。山峰就是转化成灰度图后数值大的地方，山谷就是转化成灰度图后数值小的地方。在每个山谷以不同颜色的水从下至上注入进来，水位线在每个山谷慢慢上移，最终不同颜色的水会交接，交接处就是我们要找的分水岭。分水岭操作的实现，以及一些关键的解释都在代码块中：# 分水岭操作:# 流程：输入图像--->灰度--->二值化-...
复制链接

扫一扫

专栏目录