


    在基于计算机视觉的图像前景提取方面,Grabcut 是最流行的方法之一。在 Grabcut 中,我们提供了一个矩形区域,其中可能存在感兴趣的对象。之后,Grabcut 算法会处理其余部分。

    那么,如果不使用 Grabcut 算法,我们该怎么做呢?



    我们可以使用轮廓检测技术来实现这一点。使用轮廓检测,我们可以找到我们想要提取的对象周围的像素,然后继续进行。我们将在本文中详细介绍如何使用 OpenCV 轮廓检测实现图像前景提取。





    我使用的是 版本。虽然我建议使用与我相同的版本,但如果使用任何 4.x 版本,您仍然不会遇到任何问题。



│   extract_foreground.py
│   utils.py
│       background.jpg
│       image_1.jpg
│       image_2.jpg
│       image_3.jpg
│       ...
  • 在父项目目录中,我们有两个 Python 文件,extract_foreground.py和utils.py。
  • 输入文件夹包含我们将在本教程中使用的输入图像。总共有四张图片。
  • 最后,输出运行 Python 脚本后,文件夹将包含输出图像。


  • 1.




    这里的所有代码都将进入utils.py文件。此 Python 文件包含一些实用函数,我们可以在需要时执行这些函数。我们将这些函数分开,以便我们的代码尽可能保持干净和易读。


import cv2
import numpy as np
def find_largest_contour(image):
    This function finds all the contours in an image and return the largest
    contour area.
    :param image: a binary image
    image = image.astype(np.uint8)
    contours, hierarchy = cv2.findContours(
    largest_contour = max(contours, key=cv2.contourArea)
    return largest_contour
    我们可能需要在extract_foreground.py文件。而不是执行 OpenCV 的imshow()和waitKey()几次,我们可以定义一个函数,只用一行代码来处理可视化。

def show(name, image):
    A simple function to visualize OpenCV images on screen.
    :param name: a string signifying the imshow() window name
    :param image: NumPy image to show 
    cv2.imshow(name, image)
def apply_new_background(mask3d, foreground, save_name):
    This function applies a new background to the extracted foreground image
    if `--new-background` flag is `True` while executing the file.
    :param mask3d: mask3d mask containing the foreground binary pixels
    :param foreground: mask containg the extracted foreground image
    :param save_name: name of the input image file
    # normalization of mask3d mask, keeping values between 0 and 1
    mask3d = mask3d / 255.0
    # get the scaled product by multiplying
    foreground = cv2.multiply(mask3d, foreground)
    # read the new background image
    background = cv2.imread('input/background.jpg')
    # resize it according to the foreground image
    background = cv2.resize(background, (foreground.shape[1], foreground.shape[0]))
    background = background.astype(np.float)
    # get the scaled product by multiplying
    background = cv2.multiply(1.0 - mask3d, background)
    # add the foreground and new background image
    new_image = cv2.add(foreground, background)
    show('New image', new_image.astype(np.uint8))
    cv2.imwrite(f"outputs/{save_name}_new_background.jpg", new_image)
    这应用新背景()函数接受三个参数。一个是mask3d,即前景图像蒙版。前景参数是提取的前景对象(RGB 格式)。保存名称是字符串,我们将用它将新图像保存到磁盘。

    第一步是实现正常化mask3d并得到缩放后的图像mask3d和前景使用cv2.multiply(第 34 和 36 行)。


    在第 43 行,我们再次使用cv2.multiply得到缩放后的产品1-mask3d和新的背景。



    我们已经完成了所需的所有实用函数。现在我们可以继续编写使用 OpenCV 轮廓检测进行图像前景提取的代码。

使用 OpenCV 轮廓检测进行图像前景提取的代码

    接下来,我们将在extract_foreground.py文件。此 Python 文件将包含我们使用 OpenCV 轮廓检测方法提取前景图像/对象所需的所有代码。


import numpy as np
import cv2
import argparse
from utils import show, apply_new_background, find_largest_contour
# define the argument parser
parser = argparse.ArgumentParser()
parser.add_argument('-i', '--input', help='path to the input image',
parser.add_argument('-n', '--new-background', dest='new_background',
args = vars(parser.parse_args())
image = cv2.imread(args['input'])
show('Input image', image)
# blur the image to smmooth out the edges a bit, also reduces a bit of noise
blurred = cv2.GaussianBlur(image, (5, 5), 0)
# convert the image to grayscale 
gray = cv2.cvtColor(blurred, cv2.COLOR_BGR2GRAY)
# apply thresholding to conver the image to binary format
# after this operation all the pixels below 200 value will be 0...
# and all th pixels above 200 will be 255
ret, gray = cv2.threshold(gray, 200 , 255, cv2.CHAIN_APPROX_NONE)
# find the largest contour area in the image
contour = find_largest_contour(gray)
image_contour = np.copy(image)
cv2.drawContours(image_contour, [contour], 0, (0, 255, 0), 2, cv2.LINE_AA, maxLevel=1)
show('Contour', image_contour)
    我们称之为find_largest_contour()在第 24 行,同时将二进制图像作为参数传递。该函数返回最大的轮廓区域。然后我们创建原始图像的副本并将该轮廓区域应用于图像。我们用绿色标记所有像素,以完美地可视化轮廓区域。我们将在执行代码时看到此输出。




# create a black `mask` the same size as the original grayscale image 
mask = np.zeros_like(gray)
# fill the new mask with the shape of the largest contour
# all the pixels inside that area will be white 
cv2.fillPoly(mask, [contour], 255)
# create a copy of the current mask
res_mask = np.copy(mask)
res_mask[mask == 0] = cv2.GC_BGD # obvious background pixels
res_mask[mask == 255] = cv2.GC_PR_BGD # probable background pixels
res_mask[mask == 255] = cv2.GC_FGD # obvious foreground pixels
    首先,我们在第 29 行创建上面讨论的掩码。

    在第 32 行,我们用白色像素填充创建的蒙版上的一个区域,该区域的形状将与我们迄今为止获得的最大轮廓的形状相同。例如,如果最大的轮廓区域是人的,那么我们在新蒙版上创建该形状并用白色像素填充该区域。

    接下来的几行很重要。第 35 行创建了面具以免编辑原始蒙版。

    在创建新蒙版时,我们将所有像素值都设为零。这意味着蒙版全是黑色。然后我们用白色轮廓形状填充它,将所有像素标记为 255。这意味着我们确切地知道所有黑色像素构成背景,所有白色像素构成前景或对象。

    因此,在第 36 行,我们说任何值为 0 的像素肯定是背景像素。我们使用cv2. GC_BGD。

    第 37 行表示,任何值为 255 的像素都可能是前景。我们使用cv2. GC_PR_BGD。

    但由于所有像素都是 0 或 255,我们确信值为 255 的像素肯定是前景。因此,我们在第 38 行也使用以下代码标记了明显的前景:cv2. GC_FGD。





# create a mask for obvious and probable foreground pixels
# all the obvious foreground pixels will be white and...
# ... all the probable foreground pixels will be black
mask2 = np.where(
    (res_mask == cv2.GC_FGD) | (res_mask == cv2.GC_PR_FGD),
    在缓冲区掩码,我们已经标记了明显且可能的前景像素。因此,在创建新的掩码2,无论哪个像素肯定是前景缓冲区掩码填充值为 255。并且任何像素都是可能的前景缓冲区掩码用 0 值填充掩码2最终,我们将整个新掩码2转换为 8 位无符号整数格式。最后,上述步骤为我们提供了一个二进制掩码(二维),其中所有像素均为黑色或白色。




# create `new_mask3d` from `mask2` but with 3 dimensions instead of 2
new_mask3d = np.repeat(mask2[:, :, np.newaxis], 3, axis=2)
mask3d = new_mask3d
mask3d[new_mask3d > 0] = 255.0
mask3d[mask3d > 255] = 255.0
# apply Gaussian blurring to smoothen out the edges a bit
# `mask3d` is the final foreground mask (not extracted foreground image)
mask3d = cv2.GaussianBlur(mask3d, (5, 5), 0)
show('Foreground mask', mask3d)
    使用mask2,我们创建一个new_mask3d最后再增加一个维度来复制 3D 图像。然后mask3d成为我们最终的蒙版,我们在第 50 行和第 51 行对其进行像素级操作。在第 54 行,我们对最终的 3D 蒙版应用高斯模糊,使边缘更平滑一些。


# create the foreground image by zeroing out the pixels where `mask2`...
# ... has black pixels
foreground = np.copy(image).astype(float)
foreground[mask2 == 0] = 0
show('Foreground', foreground.astype(np.uint8))
    在第 58 行,我们创建原始图像的副本并将其保存为前景. 然后,掩码2为零,我们让它们在前景也是。它们是我们不需要的背景像素。我们在第 59 行执行此操作。我们有最终的前景图像。这意味着我们已成功使用 OpenCV 轮廓检测进行图像前景提取。

    只剩下几个步骤了。首先是保存所有前景图像、最终的 3D 蒙版以及检测到轮廓的图像。

# save the images to disk
save_name = args['input'].split('/')[-1].split('.')[0]
cv2.imwrite(f"outputs/{save_name}_foreground.png", foreground)
cv2.imwrite(f"outputs/{save_name}_foreground_mask.png", mask3d)
cv2.imwrite(f"outputs/{save_name}_contour.png", image_contour)
# the `--new-background` flag is `True`, then apply the new background...
# ... to the extracted foreground image
if args['new_background']:
    apply_new_background(mask3d, foreground, save_name)
    这标志着使用 OpenCV 轮廓检测进行前景提取的编码结束。下一步是执行代码并分析输出。




python extract_foreground.py --input input / image_3.jpg --new -background
  • 1.


    我们在上一步中了解了使用 OpenCV 轮廓检测进行图像前景提取的局限性。但也有一些方法可以克服这个问题。


    使用 Grabcut 算法并按照预期的步骤进行图像前景提取。
