1.图像对象
图像是由一个个像素组成的,像素越多,体现到图像就是更加清晰,有更多的细节。举个例子,通常来说的分辨率,1080P,720P,480P就是指像素的数量,数量越多就越清晰。
2.打印图像的像素值
import cv2
image = 'D:\papercode\AI\Ai-Dentist-Sample-Code-main\opencv\car_recognition\car.jpg'
#读取图片
image = cv2.imread(image)
print("image0",image)
print("image1",image[0])
print("image2",image[0][0])
print("image3",image[0][0][0])
print("image0",image.shape)
print("image1",image[0].shape)
print("image2",image[0][0].shape)
print("image3",image[0][0][0].shape)
结果展示:
image1 [[ 52 81 85]
[ 75 102 106]
[ 91 110 113]
...
[229 208 193]
[229 208 193]
[229 208 193]]
image2 [52 81 85]
image3 52
image0 (861, 697, 3)
image1 (697, 3)
image2 (3,)
image3 ()
输出的image0没有打印出来,太长了,不过可以从shape中看到是(861,697,3),代表的是长和宽以及通道数;image1是指定了长的位置,显示的是长为序列【0】时宽以及三个通道上的数值,对应的形状就是(697,3);image2就是选定了长和宽的位置,显示的是在该位置上的三个通道的数值,对应形状就是(3,); image3就是选定了长和宽以及通道的值,其形状说明这个元素是一个标量(scalar),而不是一个具有维度的数组或张量。
3.其他读取方式
import cv2
image = 'D:\papercode\AI\Ai-Dentist-Sample-Code-main\opencv\car_recognition\car.jpg'
#其它加载图像的方式
image1 = cv2.imread(image, cv2.IMREAD_COLOR)
image2 = cv2.imread(image,cv2.IMREAD_GRAYSCALE)
image3 = cv2.imread(image,cv2.IMREAD_UNCHANGED)
print('image1',image1.shape)
print('image2',image2.shape)
print('image3',image3.shape)
cv2.imshow('image1',image1)
cv2.imshow('image2',image2)
cv2.imshow('image3',image2)
cv2.waitKey(0)
cv2.destroyAllWindows()
输出结果:
image1 (861, 697, 3)
image2 (861, 697)
image3 (861, 697, 3)
cv2.imread(image, cv2.IMREAD_COLOR)
:
- 这行代码将以彩色模式读取图像,即使图像是多通道的,也会被读取为彩色图像。
- 如果图像是多通道的(例如RGB图像),则
image1
将会是一个三通道的彩色图像。
cv2.imread(image, cv2.IMREAD_GRAYSCALE)
:
- 这行代码将以灰度模式读取图像,将图像转换为单通道的灰度图像。
- 无论输入的图像是多通道还是单通道,
image2
都将是一个单通道的灰度图像。
cv2.IMREAD_UNCHANGED
- 是 OpenCV 中的一个常量,用于指定读取图像时保持原始图像的通道数和深度。这意味着,如果图像是一个多通道图像,那么读取后的图像将保持多通道,如果是单通道图像,也会保持单通道。
- 所以,
cv2.imread(image, cv2.IMREAD_UNCHANGED)
将以不变的方式读取图像,保持图像的通道和深度不变。
cv.waitKey()是一个键盘绑定函数。其参数是以毫秒为单位的时间。该函数等待任何键盘事件指定的毫秒。如果您在这段时间内按下任何键,程序将继续运行。如果**0**被传递,它将无限期地等待一次敲击键。它也可以设置为检测特定的按键,例如,如果按下键 a 等,我们将在下面讨论。
cv.destroyAllWindows()只会破坏我们创建的所有窗口。如果要销毁任何特定的窗口,请使用函数 cv.destroyWindow()在其中传递确切的窗口名称作为参数。
4.图像存储
#图像存储
cv2.imwrite('messigray.png', image2)
输出显示:存放到当前路径
使用函数**cv.imwrite**()保存图像。
第一个参数是文件名,第二个参数是要保存的图像。 cv.imwrite('messigray.png',img)
这会将图像以PNG格式保存在工作目录中。
5.图像灰度化的原理
图像的灰度化是将彩色图像转换为灰度图像的过程。灰度图像是一种单通道图像,每个像素只有一个数值,代表了该像素的亮度或灰度级别。灰度化的原理可以通过不同的方法实现,其中最常见的包括加权平均法、亮度法和取值法。
-
YUV亮度灰度化:
- YUV 是一种颜色编码方法,其中 Y 通道表示亮度,而 U 和 V 通道表示色度。Y 通道包含了图像的亮度信息,因此可以将 Y 通道视为灰度图像的近似。
- YUV 亮度灰度化方法直接使用 Y 通道作为灰度图像的值,忽略 U 和 V 通道。这种方法简单快速,适用于需要快速处理的场景。
- 灰度值(Gray) = 0.299 * R + 0.587 * G + 0.114 * B
-
最大值灰度化:
- 最大值灰度化方法将彩色图像的每个像素的 R、G、B 三个通道的最大值作为灰度值。这种方法可以保留图像中的最亮部分,适用于需要突出图像亮度信息的场景。
-
灰度值(Gray) =B = G = R = m a x ( [ B , G , R ] )
-
平均值灰度化:
- 平均值灰度化方法将彩色图像的每个像素的 R、G、B 三个通道的值取平均作为灰度值。这种方法简单粗暴,会使图像失去一些细节,但可以保留整体的亮度信息。
- 灰度值(Gray)= (R + G + B) / 3
-
Gamma校正灰度化:
- Gamma 校正是一种非线性操作,可以调整图像的亮度和对比度。在灰度化中,Gamma 校正可以通过以下公式进行:
灰度值 = 255 * (原始值 / 255) ^ Gamma
其中,Gamma 为大于 0 的参数,通常在 0.5 到 2.0 之间。Gamma 值越大,图像越暗;Gamma 值越小,图像越亮。Gamma 校正可以调整图像的整体亮度和对比度,适用于需要对图像进行调色和增强的场景。
- Gamma 校正是一种非线性操作,可以调整图像的亮度和对比度。在灰度化中,Gamma 校正可以通过以下公式进行:
灰度化的目的是降低图像的复杂度,减少处理的计算量,同时保留图像的主要特征和结构。在许多图像处理和计算机视觉任务中,灰度化是一个常见的预处理步骤,可以大大简化后续处理的复杂度。