访问并修改像素
访问块状区域(数组)
import numpy as np
import cv2 as cv
img = cv.imread('pic1.jpg')
# 访问特定像素及通道值
px = img[100, 100]
print(px)
blue = img[100, 100, 0] # 获取蓝色通道值
print(blue)
# 选取前五行
rows = img[:5, :, :]
print(rows.shape)
# 选取后三列
cols = img[:, -3:, :]
print(cols.shape)
切片方法得到的仍然是numpy数组,可以使用shape访问数组属性
例:rows 的shape属性为 (5(行数), 图像的列数, 通道数)。
代码运行结果:
[60 22 10]
60
(5, 1198, 3)
(1198, 3, 3)
访问单个像素值(更快方法)
# 访问 RED 值
red_value = img.item((10, 10, 2))
print(red_value)
# 修改 RED 值
img.itemset((10, 10, 2), 100)
new_red_value = img.item((10, 10, 2))
print(new_red_value)
array.item()和array.itemset())被认为更好更快,但是它们始终返回标量。如果要访问所有B,G,R值,则需要分别调用所有的array.item()。
代码运行结果:
2
100
访问图像属性
- img.shape:返回行、列和通道的元组(如果是彩色的)
- img.size:返回像素总个数
- img.dtype:返回图像数据类型
在图像处理中,每个像素都会由一个或多个数值来表示,这些数值被称为像素的值或像素强度。不同类型的图像可以使用不同的数据类型来存储像素值。以下是常见的几种图像数据类型:
- uint8:无符号8位整型,范围为 0~255,通常用于表示灰度图像或彩色图像的单通道。
- uint16:无符号16位整型,范围为0~65535,通常用于表示需要更高精度的灰度图像或彩色图像的单通道。
- float32:单精度浮点型,通常用于表示像素值范围较大、需要进行浮点运算的图像。
- float64:双精度浮点型,通常用于更高精度的图像处理。
设置ROI
类似前面访问五行三列的方式,使用numpy数组索引对图像进行切片操作
import numpy as np
import cv2 as cv
img = cv.imread('pic1.jpg')
cv.namedWindow('image')
print(img.shape)
# 复制脸然后移到另一处
face = img[280:780, 330:730]
img[200:700, 100:500] = face
cv.imshow('image', img)
k = cv.waitKey(0) & 0xFF
if k == 27:
cv.destroyAllWindows()
分割和合并图像通道
将BGR图像拆分成单个通道。
# 方法1:使用split以及merge函数
b, g, r = cv.split(img)
img = cv.merge((b, g, r))
# 方法2:使用numpy索引
b = img[:, :, 0]
img[:, :, 2] = 0
注意:cv.split() 是一项耗时的操作(就时间而言)。因此,仅在必要时才这样做。否则请进行Numpy 索引。
为图像设置边框
使用cv.copyMakeBorder(),参数列表如下:
- src - 输入图像
- top,bottom,left,right 边界宽度(以相应方向上的像素数为单位)
- borderType - 定义要添加哪种边框的标志。它可以是以下类型:
- cv.BORDER_CONSTANT - 添加恒定的彩色边框。该值应作为下一个参数给出。
- cv.BORDER_REFLECT - 边框将是边框元素的镜像,如下所示: fedcba | abcdefgh | hgfedcb
- cv.BORDER_REFLECT_101或 cv.BORDER_DEFAULT与上述相同,但略有变化,例 如: gfedcb | abcdefgh | gfedcba
- cv.BORDER_REPLICATE最后一个元素被复制,像这样: aaaaaa | abcdefgh | hhhhhhh
- cv.BORDER_WRAP难以解释,它看起来像这样: cdefgh | abcdefgh | abcdefg value -边框的颜色,如果边框类型为cv.BORDER_CONSTANT
边框示例: