从零开始学cv-3：图像处理入门（下）-CSDN博客

本文链接：https://blog.csdn.net/HanWenKing/article/details/141100849

文章目录

引言
一、图像通道的拆分与合并
二，图像灰度化
三，图像二值化
四，图像轮廓基础操作
总结

引言

在上篇文章中，我们探讨了图像处理的基础操作。在本篇文章中，我将带领大家进一步深入图像处理的世界，探讨更高级的技巧和方法。我们将一起探索如何通过这些高级功能，实现更加精准和高效的图像分析、增强和转换，从而在视觉技术领域迈出更为坚实的一步。

一、图像通道的拆分与合并

在图像处理领域，分别处理每个颜色通道是一项基础且关键的技术。在某些应用场景下，虽然其他通道的信息对识别精度的提升有限，但它们可能会增加三倍的运算负担。此外，对特定通道进行加权处理可以显著提高检测的准确性。例如，在定位物体时，颜色信息往往并非关键因素。在这种情况下，将图像转换为灰度图是一个有效策略，这样做可以加快检测速度并减少计算资源的消耗。在OpenCV中，可以使用cv2.split()函数来分离图像的各个颜色通道，从而实现对每个通道的独立处理。
例子：

# 1.19 图像拆分通道
import cv2
import numpy as np
img1 = cv2.imread(r"D:\pythonProject\1.jpg", flags=1)
img1=cv2.resize(img1,(0,0),fx=0.3,fy=0.3)# flags=1 读取彩色图像(BGR
cv2.imshow("BGR", img1)  # BGR 图像
# BGR 通道拆分
bImg, gImg, rImg = cv2.split(img1)  # 拆分为 BGR 独立通道
cv2.imshow("rImg", rImg)  # 显示红色分量 rImg 显示为灰度图像
cv2.imshow("gImg", gImg) # 显示绿色分量 rImg 显示为灰度图像
cv2.imshow("bImg", bImg) # 显示蓝色分量 rImg 显示为灰度图像
print(img1.shape, rImg.shape)
cv2.waitKey(0)
cv2.destroyAllWindows()  # 释放所有窗口

效果：
在这里插入图片描述
由此可见，图像中的不同颜色通道承载着各异的信息量，这些信息对于图像分析和处理的重要性因场景而异。在开展项目工作时，我们应当对图像进行细致的通道分析。通过将图像分解为单独的颜色通道，我们可以逐一审视每个通道所包含的信息。这一步骤有助于我们识别并理解哪些颜色通道在当前任务中携带了更为关键的数据。基于这种分析，我们可以有针对性地选择信息丰富、对项目目标贡献较大的颜色通道进行进一步处理。这样的选择不仅优化了信息处理的效率，还可能提高最终结果的准确性和可靠性。
在图像处理过程中，对每个颜色通道单独处理之后，通常需要将处理过的通道重新合并，以生成新的图像。使用 OpenCV 的 cv2.merge() 函数可以实现这一操作。
合并通道前，需要确保以下条件得到满足：
单通道图像分量：参与合并的 B、G、R 单通道图像分量必须是二维数组，其形状为 (width, height)，而不是三维数组 (width, height, channels=3)。
图像大小一致：所有单通道图像分量的尺寸 (width, height) 必须完全相同，否则无法进行合并。
通道顺序：合并时，通道必须按照正确的顺序排列，即蓝色 (B)、绿色 (G)、红色 ®，以确保合并后的图像是 BGR 格式。
例子：

import cv2
import numpy as np
img1 = cv2.imread(r"D:\pythonProject\1.jpg", flags=1)# flags=1 读取彩色图像(BGR
img1=cv2.resize(img1,(0,0),fx=0.3,fy=0.3)
cv2.imshow("BGR", img1)  # BGR 图像
# BGR 通道拆分
bImg, gImg, rImg = cv2.split(img1)  # 拆分为 BGR 独立通道
img2 = cv2.merge([bImg, gImg, rImg]) #合并图像
cv2.imshow("img2",img2)
cv2.waitKey(0)
cv2.destroyAllWindows()  # 释放所有窗口

二，图像灰度化

在许多实际应用中，例如工业领域的螺丝螺母松动检测或钢材木材缺陷检测，图像的颜色信息对检测的准确性贡献有限。在这种情况下，将彩色图像转换为灰度图像可以显著提高推理速度并减少计算资源的消耗。图像灰度化是将彩色图像的三个颜色通道合并为一个单通道的过程，每个彩色通道本身实际上就是一个灰度图像。
在 OpenCV 中，灰度化通常通过 cv2.cvtColor() 函数实现，该函数使用特定的权重来合并彩色图像的三个通道。这些权重是根据人眼对不同颜色的敏感度来确定的，具体的公式如下：
gray = 0.299 * R + 0.587 * G + 0.144 * B
其中，R、G 和 B 分别代表红色、绿色和蓝色通道的像素值。按照上述公式，红色通道的贡献权重为 0.299，绿色通道为 0.587，蓝色通道为 0.144。
cv2.cvtColor(src，code)说明：

src: 输入图像，即要转换颜色空间的图像。它应该是一个 numpy 数组，通常是使用 cv2.imread() 或其他方式加载的图像。
code: 颜色空间转换码，它指定了输入图像 src 应该如何转换到目标颜色空间。这是一个非常重要的参数，因为它决定了转换的类型。以下是一些常见的颜色空间转换码：
cv2.COLOR_BGR2RGB: 将 BGR 格式转换为 RGB 格式。
cv2.COLOR_RGB2BGR: 将 RGB 格式转换为 BGR 格式。
cv2.COLOR_BGR2GRAY: 将 BGR 格式转换为灰度图像。
cv2.COLOR_RGB2GRAY: 将 RGB 格式转换为灰度图像。
cv2.COLOR_GRAY2BGR: 将灰度图像转换为 BGR 格式。
cv2.COLOR_GRAY2RGB: 将灰度图像转换为 RGB 格式。
cv2.COLOR_BGR2HSV: 将 BGR 格式转换为 HSV 格式。
cv2.COLOR_RGB2HSV: 将 RGB 格式转换为 HSV 格式。
cv2.COLOR_HSV2BGR: 将 HSV 格式转换为 BGR 格式。
cv2.COLOR_HSV2RGB: 将 HSV 格式转换为 RGB 格式。

代码：

img_GRAY = cv2.cvtColor(img_BGR, cv2.COLOR_BGR2GRAY)

三，图像二值化

图像二值化是将图像中的像素值设置为两个极端值（通常是黑色和白色）的过程，以使图像只包含两种颜色。这一过程涉及设定一个阈值，根据像素的亮度与这个阈值的比较结果，将像素分为两类：高于阈值的像素设置为白色（或前景色），低于阈值的像素设置为黑色（或背景色）。二值化常用于简化图像分析，提高处理速度，并在某些应用中突出特定特征，如文本识别、物体轮廓提取等。在opencv中实现二值化的函数为v2.threshold(src, thresh, maxval, type)

cv2.threshold(src, thresh, maxval, type) ，用来将单通道灰度图像转化为二值图像，返回值有两个，第一个值为设置的阈值，第二个值为返回的二值化图片.
参数描述
src 表示的是图片源
thresh 表示的是阈值（起始值）
maxval 表示的是最大值
type 表示的是这里划分的时候使用的是方法选择参数type的类型如下如所示：

例子：
在这里，我们以上述 cv2.split() 函数为例，说明二值化过程。进行二值化时，关键是要确定目标区域的像素值，这个值应与背景有较高的区分度，以避免背景信息被错误地包含在内。以橘子图像为例，如果我们目的是提取被切开的橘子部分，可以发现蓝色通道中的橘子切面细节更为清晰，且橘子与背景的对比度较高。因此，我们选择蓝色通道进行二值化处理。

代码如下（示例）：

import cv2
import numpy as np
img1 = cv2.resize(cv2.imread(r"D:\pythonProject\1.jpg", flags=1),(512,512))  # 读取图像并转化为512*512大小
b,g,r = cv2.split(img1)  # 将图像通道进行划分
value,th_image=cv2.threshold(b,140,255,cv2.THRESH_BINARY)  # 图像二值化，将大于140像素值的点置为255 小于的点置为0
cv2.imshow("th_image",th_image)
cv2.imshow("g",b)
cv2.waitKey(0)
cv2.destroyAllWindows()  # 释放所有窗口

效果：
在这里插入图片描述

四，图像轮廓基础操作

轮廓在图像中通常表示为图像梯度变化显著的区域，它们定义了图像中物体的边界。轮廓在图像处理领域有着广泛的应用，例如在传统图像处理中，通过轮廓可以实现对物体数量、形状等特征的统计和分析。在深度学习领域，轮廓作为图像的先验知识，有助于提升图像重建和分割的效果。OpenCV 提供了轮廓检测的功能，主要通过 contours,hierarchy=cv2.findContours(image,method,offset) 函数实现。
函数说明：

image: 输入的图像，它是一个二值图像，通常是通过阈值处理或边缘检测得到的。
mode: 轮廓检索模式，它决定了如何检索和表示轮廓。以下是一些常用的模式：
cv2.RETR_EXTERNAL: 只检测最外层的轮廓。
cv2.RETR_LIST: 检测所有轮廓，但不建立轮廓间的层次关系。
cv2.RETR_CCOMP: 检测所有轮廓，并将它们组织为两层：顶层和孔洞层。
cv2.RETR_TREE: 检测所有轮廓，并重新建立轮廓间的完整层次关系。
method: 轮廓逼近方法，它决定了如何从边缘检测结果中提取轮廓。以下是一些常用的方法：
cv2.CHAIN_APPROX_NONE: 存储轮廓的所有点。
cv2.CHAIN_APPROX_SIMPLE: 仅存储轮廓的拐点，减少数据量。
cv2.CHAIN_APPROX_TC89_L1 和 cv2.CHAIN_APPROX_TC89_KCOS: 使用特定的链码方法来逼近轮廓。
offset: 可选参数，它表示轮廓点的偏移量。

返回值：

contours: 检测到的轮廓列表。每个轮廓是一个点的列表，其中每个点是一个元组 (x, y)。
hierarchy: 轮廓的层次信息。如果 mode 参数设置为 cv2.RETR_TREE，则 hierarchy 包含轮廓之间的层次关系。否则，它可能为 None。

在轮廓提取后，可利用质心、面积和周长等属性进行过滤。质心由一阶图像矩计算得出，OpenCV中使用 cv2.moments() 获取。面积可通过 cv2.moments() 或 cv2.contourArea() 计算。周长由 cv2.arcLength() 计算，需指定轮廓是否闭合。此外，可获取外接矩形，包括无旋转的 cv2.boundingRect() 和考虑旋转的 cv2.minAreaRect()，后者返回中心点、长宽和角度，可用 cv2.boxPoints() 转换为角点。

例子：

import cv2
import numpy as np


imgpath = r'D:\pythonProject\R-C.jpg'

image = cv2.imread(imgpath)
image = cv2.resize(image,(640,480))
b,g,r = cv2.split(image)  # 划分三通道

_, binary = cv2.threshold(g,130,255,cv2.THRESH_BINARY)  # 对绿色通道进行二值化处理
contours, _ = cv2.findContours(binary,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)  #查找轮廓 方式为返回所有的轮廓，并入同
area = []

for k in range(len(contours)):
    area.append(cv2.contourArea(contours[k]))

max_idx = np.argmax(np.array(area))
cv2.drawContours(image, contours, int(max_idx), (0, 255, 0), -1)  # 绘制轮廓，绘制方法为填充
cv2.imshow("image",image)
x, y, w, h = cv2.boundingRect(contours[max_idx])  #（x,y）为矩形左上角的坐标，（w,h）是矩形的宽和高
cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 255), 1)  # 画出外接矩形
cv2.imshow("rectangle",image)
mom = cv2.moments(contours[max_idx])
pt = (int(mom['m10'] / mom['m00']), int(mom['m01'] / mom['m00']))  # 使用前三个矩m00, m01和m10计算重心
cv2.circle(image, pt, 2, (0, 0, 255), 2)  # 画出红色质心
cv2.imshow("center", image)
cv2.waitKey(0)

效果：
在这里插入图片描述

总结

本篇文章系统地介绍了图像处理的基础知识，涵盖了图像像素赋值、图像创建、图像拼接、裁剪与缩放、图像通道拆分与合并、图像二值化、图像轮廓查找等多个关键概念和技术。文章通过详细的代码示例和效果展示，帮助读者理解并掌握这些基础操作。通过学习这些内容，读者将能够更好地理解和掌握图像处理的基本原理，为后续的深入研究和实际应用打下坚实的基础。