opencv---分水岭操作

分水岭操作的原理及实现


分水岭操作的原理:
把图像看成是山峰与山谷的交汇。山峰就是转化成灰度图后数值大的地方,山谷就是转化成灰度图后数值小的地方。在每个山谷以不同颜色的水从下至上注入进来,水位线在每个山谷慢慢上移,最终不同颜色的水会交接,交接处就是我们要找的分水岭。


分水岭操作的实现,以及一些关键的解释都在代码块中:

# 分水岭操作:
# 流程:输入图像--->灰度--->二值化--->距离变换--->寻找种子--->生成Marker--->分水岭变换--->输出图像--->End

#   (一)获取灰度图像,二值化图像,进行形态学操作,消除噪点
#   (二)在距离变换前加上一步操作:通过对上面形态学去噪点后的图像,进行膨胀操作,可以得到大部分都是背景的区域(原黑色不是我们需要的部分是背景)
#   
#   (三)使用距离变换distanceTransform获取确定的前景色
# 相关知识补充(重点)
#   (四)在获取了背景区域和前景区域(其实前景区域是我们的种子,我们将从这里进行灌水,向四周涨水,但是这个需要在markers中表示)后,这两个区域中有未重合部分(注1)怎么办?首先确定这些区域(寻找种子)
#    开始获取未知区域unknown(栅栏会创建在这一区域),为下一步获取种子做准备
#    (五)获取了这些区域,我们可以获取种子,这是通过connectedComponents实现,获取masker标签,确定的前景区域会在其中显示为以1开始的数据,这就是我们的种子,会从这里开始漫水
#   重点:
#   (六)根据未知区域unknown在markers中设置栅栏,并将背景区域加入种子区域,一起漫水
#   (七)根据种子开始漫水,让水漫起来找到最后的漫出点(栅栏边界),越过这个点后各个山谷中水开始合并。注意watershed会将找到的栅栏在markers中设置为-1
import cv2 as cv
import numpy as np


def watershed_demo():
    src = cv.imread("D:/pythonprograms/tutorial1/images/detect_circle_demo.png")
    cv.imshow("input image", src)
    print(src.shape)
    blurred = cv.pyrMeanShiftFiltering(src, 10, 100)  # 去噪
    # 灰度,二值化
    gray = cv.cvtColor(blurred, cv.COLOR_BGR2GRAY)
    ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY | cv.THRESH_OTSU)
    cv.imshow("binary_image", binary)

    # 形态学操作,进一步消除噪点
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (3, 3))
    mb = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel, iterations=2)  # 连续两次开操作,消除图像的噪点
    # 在距离变换前加上一步操作:通过对上面形态学去噪点后的图像,进行膨胀操作,可以得到大部分都是背景的区域(原黑色不是我们需要的部分是背景)
    sure_bg = cv.dilate(mb, kernel, iterations=3)  # 3次膨胀,可以获取到大部分都是背景的区域

    cv.imshow("mor-opt", sure_bg)

    # 距离:使用距离变换distanceTransform获取确定的前景色:主要用于计算非零像素到最近零像素点的最短距离。一般用于求解图像的骨骼
    # 根据distanceTransform获取距离背景最小距离的结果

    # 距离变换的处理图像通常都是二值图像,而二值图像其实就是把图像分为两部分,即背景和物体两部分,物体通常又称为前景目标!
    # 通常我们把前景目标的灰度值设为255,即白色
    # 背景的灰度值设为0,即黑色。
    # 所以定义中的非零像素点即为前景目标,零像素点即为背景。
    # 所以图像中前景目标中的像素点距离背景越远,那么距离就越大,如果我们用这个距离值替换像素值,那么新生成的图像中这个点越亮。
    # 再通过设定合理的阈值对距离变换后的图像进行二值化处理,则可得到去除手指的图像(如下图“bidist”窗口图像所示),手掌重心即为该图像的几何中心。

    # def distanceTransform(src, distanceType, maskSize, dst=None,
    #                       dstType=None)
    # src:输入的图像,一般为二值图像
    # distanceType:所用的求解距离的类型,有CV_DIST_L1, CV_DIST_L2, or CV_DIST_C
    # mask_size:距离变换掩模的大小,可以是3或5.对CV_DIST_L1或CV_DIST_C的情况,参数值被强制设定为3, 因为3×3mask给出5×5mask一样的结果,而且速度还更快。
    dist = cv.distanceTransform(mb, cv.DIST_L2, 3)  ##这是我们获取的字段距离数值,对应每个像素都有,所以数组结构和图像数组一致

    # 若是想骨骼显示(对我们的分水岭流程无影响),我们需要对distanceTransform返回的结果进行归一化处理,使用normalize
    #  在整数表示的颜色空间中,数值范围是0 - 255,但在浮点数表示的颜色空间中,数值范围是0 - 1.0,所以要把0 - 255归一化。
    #  顺便补充:若是不做归一化处理,数值大于1的都会变为1.0处理
    dist_output = cv.normalize(dist, 0, 1.0, cv.NORM_MINMAX)  # 归一化的距离图像数组
    cv.imshow("distance-t", dist_output * 50)  # *50增加亮度,以便能显示出来

    # 根据distanceTransform操作的结果,设置一个阈值,使用threshold决定哪些区域是前景,这样得到正确结果的概率很高
    # 这里是求取硬币偏白色,使用THRESH_BINARY,所以我们获取对象是白色区域,是获取未重合部分
    # 若是我们求取树叶等偏黑,需要使用THRESH_BINARY_INV,此时我们获取的对象是黑色区域,就变为了获取重合部分了
    ret, surface = cv.threshold(dist, dist.max() * 0.6, 255, cv.THRESH_BINARY)  # 获取前景色
    cv.imshow("surface-bin", surface)

    # marker
    surface_fg = np.uint8(surface)  ##保持色彩空间一致才能进行运算,现在是背景空间为整型空间,前景为浮点型空间,所以进行转换
    unknow = cv.subtract(sure_bg, surface_fg)
    cv.imshow("unknow",unknow)

    # 获取了这些区域,我们可以获取种子,这是通过connectedComponents实现, 获取masker标签,确定的前景区域会在其中显示为以1开始的数据,这就是我们的种子,会从这里开始漫水
    # 现在知道了那些是背景那些是硬币(确定的前景区域)了。
    # 那我们就可以创建标签(一个与原图像大小相同,数据类型为in32的数组),并标记其中的区域了。
    # 对我们已经确定分类的区域(无论是前景还是背景)使用不同的正整数标记,对我们不确定的区域(unknown区域)使用0标记。我们可以使用函数cv2.connectedComponents()来做这件事。
    # 它会把对标签进行操作,将背景标记为0,其他的对象使用从1开始的正整数标记(其实这就是我们的种子,水漫时会从这里漫出)。然后将这个标签返回给我们markers
    # 但是,我们知道如果背景标记为0,那分水岭算法就会把它当成未知区域了。(我们要将未知区域标记为0,所以我们要将背景区域变为其他整数,例如 + 1)
    # 所以我们想使用不同的整数标记它们。
    # 而对不确定的区域(函数cv2.connectedComponents输出的结果中使用unknown定义未知区域)标记为0。

    # 参数image是需要进行连通域处理的二值图像,其他的这里用不到
    # ret是连通域处理的边缘条数,是上面提到的确定区域(出去背景外的其他确定区域:就是前景),就是种子数,我们会从种子开始向外涨水
    # markers是我们创建的一个标签(一个与原图像大小相同,数据类型为in32的数组),其中包含有我们原图像的确认区域的数据(前景区域)
    # 返回值是标签总数,输出的是标记图像,所谓标记图像就是图像中每一个连通域都拥有一个标签(背景的标签是0),该标签即代表了此连通域的灰度值。例如,一幅图像中存在3个连通域(背景除外),那么他们的标签分别是1、2、3,他们的灰度值分别是1、2、3。
    ret, markers = cv.connectedComponents(surface_fg)
    print(ret)

    # 分水岭变换:
    # watershed漫水算法需要我们将栅栏区域设置为0,所以我们需要将markers中背景区域(原来为0,会干扰算法)设置为其他整数。
    # 解决方法将markers整体加一    # 此时种子区域不止我们原来的前景区域,又增加了一个背景区域,我们将从这些区域一起灌水
    markers = markers + 1
    markers[unknow == 255] = 0

    # 根据种子开始漫水,让水漫起来找到最后的漫出点(栅栏边界),越过这个点后各个山谷中水开始合并。注意watershed会将找到的栅栏在markers中设置为 - 1
    markers = cv.watershed(src, markers=markers)      #获取栅栏
    src[markers == -1] = [0, 0, 255]                  #根据栅栏,我们对原图像进行操作,对栅栏区域设置为红色
    cv.imshow("result", src)


print("------Hello Opencv-----")
# src=cv.imread("D:/pythonprograms/tutorial1/images/demo.png")
# cv.namedWindow("This is a image",cv.WINDOW_AUTOSIZE)
watershed_demo()
cv.waitKey(0)
cv.destroyAllWindows()


运行结果:
输入图像在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

代码是跟着贾志刚讲师敲的,注释参考了很多人的文章,也加了自己的理解,下面贴一个我觉得目前找到的最好的注释版本。
https://www.cnblogs.com/ssyfj/p/9278815.html

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值