计算机视觉：图像分割之图割法

最新推荐文章于 2025-02-15 15:58:33 发布

目标四级424

最新推荐文章于 2025-02-15 15:58:33 发布

阅读量4.5k

点赞数 3

分类专栏：计算机视觉文章标签：计算机视觉 opencv python

本文链接：https://blog.csdn.net/weixin_51998427/article/details/130942183

版权

计算机视觉专栏收录该内容

8 篇文章

订阅专栏

计算机视觉：图像分割之图割法

文章目录

计算机视觉：图像分割之图割法

概念

图割算法是一种用于图像分割的算法，它基于图论的最大流最小割原理。图割算法的目标是将一幅图像分割成多个具有语义意义的区域，例如将前景和背景分离。

图割算法原理

图割算法的基本思想是将图像表示为图的形式，其中图的节点表示图像中的像素，图的边表示像素之间的关系。通过给图的节点和边分配权重，图割算法可以根据像素之间的相似性和连接性来进行分割。

算法的核心是在图上找到一个割，将图分成两个部分：前景和背景。这个割是通过最小化割的代价函数来确定的，该代价函数由像素之间的相似性、像素与前景/背景的关联以及割的形状等因素构成。

图割算法的基本流程

构建图：将图像转换为图的形式，其中节点表示像素，边表示像素之间的关系。
定义代价函数：为图的节点和边分配权重，定义代价函数，考虑像素之间的相似性和连接性。
寻找最小割：使用最大流最小割算法在图上寻找最小割，将图分割成前景和背景。
输出分割结果：根据最小割的结果，将图像的像素分配到前景或背景中。

图割操作实现

Python中的OpenCV库提供了grabCut函数，它可以实现交互式图像分割。通过为图像提供标记或边界框，grabCut函数可以自动进行图像分割并输出分割结果。

cv2.grabCut()主要参数如下

image：待分割的图像。
mask：与图像大小相同的掩码，用于指定初始的前景和背景区域。
rect：用于初始化GrabCut算法的矩形区域，表示包含前景的边界框。
bgdModel和fgdModel：背景模型和前景模型的数组，用于存储概率模型的参数。这些参数通常是大小为(1, 65)的二维数组。
iterCount：迭代次数，控制算法的迭代次数。
mode：用于指定GrabCut算法的模式，有两个可选值：cv2.GC_INIT_WITH_RECT和cv2.GC_INIT_WITH_MASK。GC_INIT_WITH_RECT表示使用矩形区域初始化算法，GC_INIT_WITH_MASK表示使用掩码初始化算法。

这些参数用于控制GrabCut算法的执行过程，其中image、mask和rect是必需的参数，而其他参数有默认值，可以根据需要进行调整。

实现代码：

import cv2
import numpy as np

# process_grabcut 函数：执行GrabCut算法进行图像分割的函数。
def process_grabcut(image, mask, rect):
    # 创建背景模型和前景模型
    bgd = np.zeros((1, 65), np.float64)
    fgd = np.zeros((1, 65), np.float64)

    # 使用GrabCut算法进行分割(迭代次数为5)
    cv2.grabCut(image, mask, rect, bgd, fgd, 5, cv2.GC_INIT_WITH_RECT)

    # 将不确定区域（可能是前景或背景）标记为可能的前景
    mask_fg_bg = np.where((mask == 2) | (mask == 0), 0, 1).astype('uint8')

    # 对原始图像应用分割结果
    result = image * mask_fg_bg[:, :, np.newaxis]

    return result

# 加载图像
image = cv2.imread('ex5/animal.jpg')
mask = np.zeros(image.shape[:2], np.uint8)

window_name = '鼠标框选前景区域'
cv2.namedWindow(window_name)

# 鼠标事件回调函数
def mouse_callback(event, x, y, flags, param):
    global drawing, rect

    if event == cv2.EVENT_LBUTTONDOWN:
        drawing = True
        # 记录鼠标按下的位置作为边界框的起点
        rect = (x, y, 1, 1)
    
    elif event == cv2.EVENT_LBUTTONUP:
        drawing = False
        # 计算边界框的宽度和高度
        rect = (rect[0], rect[1], x - rect[0], y - rect[1])
        
        # 执行GrabCut算法
        result = process_grabcut(image, mask, rect)
        
        # 显示结果
        cv2.imshow(window_name, result)

cv2.setMouseCallback(window_name, mouse_callback)

# 显示原始图像
cv2.imshow(window_name, image)

cv2.waitKey(0)
cv2.destroyAllWindows()