深入学习OpenCV检测及分割图像的目标区域

最新推荐文章于 2024-08-05 17:27:55 发布

weixin_30539835

最新推荐文章于 2024-08-05 17:27:55 发布

阅读量1.8k

点赞数

文章标签：人工智能 c/c++

原文链接：http://www.cnblogs.com/wj-1314/p/9578493.html

版权

本文介绍了如何使用OpenCV进行图像处理，包括图像通道分离、旋转、仿射变换和伽马修正。详细讲解了从图像载入、转换灰度、去噪、梯度提取到形态学操作的步骤，最终实现目标区域的轮廓检测和裁剪。适合对计算机视觉和OpenCV感兴趣的读者。

摘要由CSDN通过智能技术生成

准备1：OpenCV常用图片转换技巧

　　在进行计算机视觉模型训练前，我们经常会用到图像增强的技巧来获取更多的样本，但是有些深度学习框架中的方法对图像的变换方式可能并不满足我们的需求，所以掌握OpenCV中一些常用的图像处理技巧对我们还是有很多帮助的。

图像通道分离

　　我们知道每个图像是由RGB三个颜色通道构成，所以我们可以使用split函数对原图像的三个通道进行分离：

B, G, R = cv2.split(img)

　　进行通道分离的后，我们就可以在每个通道上独立的进行数值变换，变换完成后再来组合来生成新的图像，比如提升图像的亮度：

B,G,R = cv2.split(img)
for i in (B,G,R):
    randint = random.randint(50,100)
    limit = 255-randint
    i[i>limit]=255
    i[i<=limit]=randint+i[i<=limit]
img_merge = cv2.merge((B,G,R))
cv2.imshow("img_merge",img_merge)
key = cv2.waitKey()
if key==27:
    cv2.destroyAllWindows()

图像旋转

　　还可以使用 warpAffine 函数根据我们的设定的角度完成图像的旋转：

M = cv2.getRotationMatrix2D((img.shape[1] / 2, img.shape[0] / 2), 30, 1)
img_rotate = cv2.warpAffine(img, M, (img.shape[1], img.shape[0]))

cv2.imshow('img_rotate', img_rotate)
key = cv2.waitKey(0)
if key == 27:
    cv2.destroyAllWindows()

　　这里我们不对图像进行缩放，旋转角度为30度。

仿射变换

　　仿射变换允许图像倾斜并且可以在任意两个方向上发生伸缩。代码如下：

def random_warp(img, row, col):
    height, width, channels = img.shape

    random_margin = 100
    x1 = random.randint(-random_margin, random_margin)
    y1 = random.randint(-random_margin, random_margin)
    x2 = random.randint(width - random_margin - 1, width - 1)
    y2 = random.randint(-random_margin, random_margin)
    x3 = random.randint(width - random_margin - 1, width - 1)
    y3 = random.randint(height - random_margin - 1, height - 1)
    x4 = random.randint(-random_margin, random_margin)
    y4 = random.randint(height - random_margin - 1, height - 1)

    dx1 = random.randint(-random_margin, random_margin)
    dy1 = random.randint(-random_margin, random_margin)
    dx2 = random.randint(width - random_margin - 1, width - 1)
    dy2 = random.randint(-random_margin, random_margin)
    dx3 = random.randint(width - random_margin - 1, width - 1)
    dy3 = random.randint(height - random_margin - 1, height - 1)
    dx4 = random.randint(-random_margin, random_margin)
    dy4 = random.randint(height - random_margin - 1, height - 1)

    pts1 = np.float32([[x1, y1], [x2, y2], [x3, y3], [x4, y4]])
    pts2 = np.float32([[dx1, dy1], [dx2, dy2], [dx3, dy3], [dx4, dy4]])
    
    
    M_warp = cv2.getPerspectiveTransform(pts1, pts2)
    img_warp = cv2.warpPerspective(img, M_warp, (width, height))
    return img_warp

img_warp = random_warp(img, img.shape[0], img.shape[1])

cv2.imshow('img_warp', img_warp)
key = cv2.waitKey(0)
if key == 27:
    cv2.destroyAllWindows()

伽马修正

　　伽马修正提升图像的对比度，让图像看起来更加的“明亮”。代码如下：

def adjust_gamma(image, gamma=1.0):
    invGamma = 1.0/gamma
    table = []
    for i in range(256):
        table.append(((i / 255.0) ** invGamma) * 255)
    table = np.array(table).astype("uint8")
    return cv2.LUT(image, table)

img_gamma = adjust_gamma(img, 2)
cv2.imshow("img",img)
cv2.imshow("img_gamma",img_gamma)

key = cv2.waitKey()
if key == 27:
    cv2.destroyAllWindows()