OpenCV-Python官方教程-20-分水岭算法图像分割

最新推荐文章于 2024-11-18 08:50:32 发布

原创最新推荐文章于 2024-11-18 08:50:32 发布 · 814 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#分水岭算法

经典图像处理同时被 3 个专栏收录

49 篇文章

订阅专栏

Opencv

40 篇文章

订阅专栏

OpenCV-Python官方教程

34 篇文章

订阅专栏

本文详细介绍了分水岭算法的原理，通过大津阈值分割、形态学开闭运算、距离变换和膨胀操作预处理图像，确定前景和背景区域。使用连接组件标记并应用分水岭算法进行分割，最终实现对硬币图像的有效分割。

1 原理

任何一副灰度图像都可以被看成拓扑平面，灰度值高的区域可以被看成是山峰，灰度值低的区域可以被看成是山谷。我们向每一个山谷中灌不同颜色的水。随着水的位的升高，不同山谷的水就会相遇汇合，为了防止不同山谷的水汇合，我们需要在水汇合的地方构建起堤坝。不停的灌水，不停的构建堤坝直到所有的山峰都被水淹没。我们构建好的堤坝就是对图像的分割。这就是分水岭算法的背后思想。

但是这种方法通常都会得到过度分割的结果，这是由噪声或者图像中其他不规律的因素造成的。为了减少这种影响OpenCV 采用了基于掩模的分水岭算法，在这种算法中我们要设置那些山谷点会汇合，那些不会。这是一种交互式的图像分割。我们要做的就是给我们已知的对象打上不同的标签。如果某个区域肯定是前景或对象，就使用某个颜色（或灰度值）标签标记它。如果某个区域肯定不是对象而是背景就使用另外一个颜色标签标记。而剩下的不能确定是前景还是背景的区域就用 0 标记。这就是我们的标签。然后实施分水岭算法。每一次灌水，我们的标签就会被更新，当两个不同颜色的标签相遇时就构建堤坝，直到将所有山峰淹没，最后我们得到的边界对象（堤坝）的值为 -1。

2 代码

import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('coin.jpg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
# 大津阈值分割并将前后景颜色反转
ret,thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)
plt.imshow(thresh,cmap='gray')
plt.show()

在这里插入图片描述

现在我们要去除图像中的所有的白噪声。这就需要使用形态学中的开运算。为了去除对象上小的空洞我们需要使用形态学闭运算。所以我们现在知道靠近对象中心的区域肯定是前景，而远离对象中心的区域肯定是背景。而不能确定的区域就是硬币之间的边界。

所以我们要提取肯定是硬币的区域。腐蚀操作可以去除边缘像素。剩下就可以肯定是硬币了。当硬币之间没有接触时，这种操作是有效的。但是由于硬币之间是相互接触的，我们就有了另外一个更好的选择：距离变换再加上合适的阈值。接下来我们要找到肯定不是硬币的区域。这是就需要进行膨胀操作了。膨胀可以将对象的边界延伸到背景中去。这样由于边界区域被去处理，我们就可以知道那些区域肯定是前景，那些肯定是背景。如下图所示。

# 得到前后景
kernel = np.ones((3, 3), dtype=np.uint8)
# 开运算去除白噪声
opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2)
# 膨胀操作得到背景
sure_bg = cv2.dilate(opening, kernel, iterations=3)

# Finding sure foreground area
# 距离变换的基本含义是计算一个图像中非零像素点到最近的零像素点的距离，也就是到零像素点的最短距离
# 其最常见的距离变换算法就是通过连续的腐蚀操作来实现，腐蚀操作的停止条件是所有前景像素都被完全
# 腐蚀。这样根据腐蚀的先后顺序，我们就得到各个前景像素点到前景中心骨架像素点的
# 距离。根据各个像素点的距离值，设置为不同的灰度值。这样就完成了二值图像的距离变换
# cv2.distanceTransform(src, distanceType, maskSize)
# 第二个参数 0,1,2 分别表示 CV_DIST_L1, CV_DIST_L2 , CV_DIST_C
dist_transform = cv2.distanceTransform(opening, 1, 5)
print(np.unique(dist_transform))
ret, sure_fg = cv2.threshold(dist_transform, 0.7 * dist_transform.max(), 255, 0)

sure_fg = np.uint8(sure_fg)
unknown = cv2.subtract(sure_bg, sure_fg)

plt.subplot(141), plt.imshow(sure_bg, cmap='gray')
plt.title('bg'), plt.xticks([]), plt.yticks([])
plt.subplot(142), plt.imshow(sure_fg, cmap='gray')
plt.title('fg'), plt.xticks([]), plt.yticks([])
plt.subplot(143), plt.imshow(dist_transform, cmap='gray')
plt.title('dist_transfrom'), plt.xticks([]), plt.yticks([])
plt.subplot(144), plt.imshow(unknown, cmap='gray')
plt.title('unknown'), plt.xticks([]), plt.yticks([])

plt.show()

[ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35.]

在这里插入图片描述

现在知道了那些是背景那些是硬币了。那我们就可以创建标签（一个与原图像大小相同，数据类型为 in32 的数组），并标记其中的区域了。对我们已经确定分类的区域（无论是前景还是背景）使用不同的正整数标记，对我们不确定的区域使用 0 标记。我们可以使用函数cv2.connectedComponents()来做这件事。它会把将背景标记为 0，其他的对象使用从 1 开始的正整数标记。

但是，我们知道如果背景标记为 0，那分水岭算法就会把它当成未知区域了。所以我们想使用不同的整数标记它们。而对不确定的区域（函数cv2.connectedComponents 输出的结果中使用 unknown 定义未知区域）标记为 0。

ret, markers1 = cv2.connectedComponents(sure_fg)
markers = markers1 + 1
markers[unknown == 255] = 0
print (np.unique(markers))
plt.imshow(markers,cmap='jet')
plt.title('markers'),plt.xticks([]),plt.yticks([])
plt.show()

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25]

结果使用 JET 颜色地图表示。深蓝色区域为未知区域。肯定是硬币的区域使用不同的颜色标记。其余区域就是用浅蓝色标记的背景了。
在这里插入图片描述

markers3 = cv2.watershed(img, markers)
img[markers3 == -1] = [255, 0, 0]

plt.subplot(121), plt.imshow(markers3, cmap='jet')
plt.title('mark'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(img)
plt.title('res'), plt.xticks([]), plt.yticks([])

plt.show()