OpenCV_Python API 官方文档学习_ cv2 图像的基本运算

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/liuqipao55/article/details/80322236

官方官方文档

Goal

Learn to:

  • Access pixel values and modify them
  • Access image properties
  • Setting Region of Image (ROI)
  • Splitting and Merging images

实现目标:

1. 访问像素值并进行修改

2. 访问图像的属性

3. 设置图像区域

4. 图像的分割与合并

这块东西几乎所有操作都主要与Numpy有关,而不是OpenCV。使用OpenCV编写更好的优化代码需要对Numpy有很好的了解。


访问和修改像素值

先加载一个彩色图像:

>>> import cv2
>>> import numpy as np
>>> img = cv2.imread('messi5.jpg')

可以通过其行和列坐标访问像素值。对于BGR图像,它返回一个蓝色、绿色、红色(再次强调!!!OpenCV里的彩色图片的色彩通道是BGR!!而不是RGB!!!!)值的数组。对于灰度图像,只返回相应的亮度。

>>> px = img[100,100]
>>> print px
[157 166 200]

# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print blue
157

您可以相同的方式修改像素值。

>>> img[100,100] = [255,255,255]
>>> print img[100,100]
[255 255 255]

警告:

    Numpy是一个用于快速数组计算的优化库。因此,简单地访问每个像素值并修改它将非常缓慢,并不推荐使用。

注:

    上面提到的方法通常用于选择数组的区域,比如前5行和最后3列。对于单个像素访问,使用array.tem()和array.itemset()更好。它总是返回一个标量。因此,如果您想访问所有B、G、R值,则需要分别调用array.tem()。

下面是一种更好的访问和编辑像素值的代码:

# accessing RED value
>>> img.item(10,10,2)
59

# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100


访问图像属性

        图像属性包括:行数、列数和通道数、图像数据类型、像素值等等。图像的形状是由访问图像属性
img.shape 访问的。它返回行、列和通道数的元组(如果图像是彩色的):

>>> print img.shape
(342, 548, 3)
小贴士:

    如果图像是灰度的,则返回的元组只包含行和列数。因此,检测加载图像是灰度图像还是彩色图像是一种很好的方法。

像素总数由访问 img.size 访问:

>>> print(img.size)
562248
    图像数据类型由 img.dtype 获得:
>>> print(img.dtype)
uint8
    img.dtype在调试过程中非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。

设置图像区域(ROI____Religion of Image)

      有时,你必须处理某些区域的图像。对于图像中的眼睛检测,首先对图像进行人脸检测,直到找到人脸,然后在人脸区域内搜索眼睛。这种方法提高了准确性和性能(因为眼睛总是长在脸上的,这样做我们可以只搜索一个小型区域)。

      ROI再次使用Numpy索引获得。在这里,我选择球并将它复制到图像中的另一个区域:
>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball

下图中,左边的球是复制过去的。原图中是不存在的:



图像的分割与合并

       当需要时,图像的B、G、R通道可以被分成独立单元。然后,各个通道可以被合并在一起以再次形成BGR图像。我们可以通过以下步骤来执行:


>>> b,g,r = cv2.split(img)
>>> img = cv2.merge((b,g,r))

>>> b = img[:,:,0]

      假设,你想把所有的红色像素都变成零,你不需要像这样分割,把它等于零。您可以简单地使用Numpy索引,这样速度更快。

img[:,:,2] = 0

警告:

cv2.split() 是一项很费时的操作(效率比较低),因此只有在必要时才使用它。一般的,Numpy索引效率要高得多,如果可能的话请使用这种方法(主要比split快很多,所以一般推荐你使用这个  - -#!)

为图像制作边界(填充)

      如果要在图像周围创建边框,就像相框一样,您可以使用 cv2.copyMakeBorder()  函数。但它更多的应用于卷积运算、零填充等。此函数采用以下参数:

  • src - 图片信息
  • topbottomleftright -  边框宽度在相应方向上的像素数
  • borderType - 定义要添加什么类型的边框的标志。它可以是以下类型:
    • cv2.BORDER_CONSTANT - 添加一个不变的彩色边框。这个值应该作为下一个参数给出。
    • cv2.BORDER_REFLECT - 边框将是边框元素的镜像反射。比如 : fedcba | abcdefgh | hgfedcb
    • cv2.BORDER_REFLECT_101 or cv2.BORDER_DEFAULT - 和上面一样,但稍微改变一下,比如 : gfedcb | abcdefgh  |gfedcba
    • cv2.BORDER_REPLICATE - 最后一个元素被复制到整个, 比如 : aaaaaa | abcdefgh | hhhhhhh
    • cv2.BORDER_WRAP -没有规律的,比如: cdefgh | abcdefgh | abcdefg
  • value - 如果边界类型为 cv2.BORDER_CONSTANT 的边界颜色

下面是演示所有这些边界类型的示例代码,以更好地理解这些类型:

import cv2
import numpy as np
from matplotlib import pyplot as plt

BLUE = [255,0,0]

img1 = cv2.imread('opencv_logo.png')

replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)

plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')

plt.show()

展开阅读全文

没有更多推荐了,返回首页