Python-OpenCV教程-4

最新推荐文章于 2024-07-01 22:12:38 发布

kq_zhou

最新推荐文章于 2024-07-01 22:12:38 发布

阅读量7.7k

点赞数 2

分类专栏： python

python 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

OpenCV版本要求在2.3.1以上

本文主要介绍OpenCV中对图像的基本操作和基本算法

1.基本操作

在Python环境下，我们有两种方式来操作图像——通过OpenCV提供的函数来操作图像或者是通过Numpy来直接修改图像的数组。这里，我们推荐使用Numpy的方式，应为它清晰并且高效。

首先我们读取一幅图像：

<span style="font-size:14px;">>>> import cv2
>>> import numpy as np

>>> img = cv2.imread('messi5.jpg')</span>

然后，我们可以直接通过行列坐标来访问这个像素的BGR值。对于灰度图像，则是访问它的灰度值。

>>> px = img[100,100]
>>> print px
[157 166 200]

# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print blue
157

然后通过这种方式也可以修改像素的值：

>>> img[100,100] = [255,255,255]
>>> print img[100,100]
[255 255 255]

但是，以上这种读取像素值的方式非常缓慢。因此，我们耿推荐使用Numpy的函数——array.item()和array.itemset()来访问。

以下是推荐的访问和修改方式：

# accessing RED value
>>> img.item(10,10,2)
59

# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100

除了访问图像的像素值，我们还能获取图像的属性——行数、列数、通道数、图像的数据类型以及像素点的数量等。

通过img.shape这个属性，我们可以得到一个记录了图像行数、列数和通道数的元组(灰度图像则只返回行列数，通过这个可以区分图像是彩色的还是灰度的)。

像素点的数量可以通过img.size这个函数获得，图像的数据类型可以通过img.dtype来获得：

>>> print img.shape
(342, 548, 3)
>>> print img.size
562248
>>> print img.dtype
uint8

有时，我们会经常对一幅图像的特定区域进行操作。比如我们要对一幅图像进行人眼检测，那么一般会先去检测人脸，然后在人脸的区域内去检测眼睛。这样做即提高的精度(因为眼睛总是长在脸上 : D)，又提高了速度(搜索区域变小了)。

我们把这种特定区域的操作叫做ROI(region of image)，下面的代码中，我们把图中的球复制到另一区域：

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball

效果如下：

Image ROI

有时我们还需要把图形的RGB通道分离，或者是把分离的三个通道合成成一幅RGB图像：

>>> b,g,r = cv2.split(img)
>>> img = cv2.merge((b,g,r))

或者

>>> b = img[:,:,0]

假设你想要把所有红色像素的值置为0：

>>> img[:,:,2] = 0

另外，cv2.split()函数运行非常消耗时间，所以在不必要的情况下最好别用。因此，我们更即推荐第二种方法。
最后，再介绍一个基本操作——边界填补(Padding)

在卷积计算、零点补偿等领域内，Padding有非常大的用处。Padding主要使用cv2.copyMakeBorder()这个函数，它需要的参数如下：

src：输入的图片

top,bottom,left,right：上下左右边界的宽度。

borderType：请参考英文页面

下面的代码显示了所有不同类型的边界：

import cv2
import numpy as np
from matplotlib import pyplot as plt

BLUE = [255,0,0]

img1 = cv2.imread('opencv_logo.png')

replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)

plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')

plt.show()

翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_basic_ops/py_basic_ops.html#basic-ops

2.基本算法

我们可以通过cv2.add()函数或者是numpy的运算res=img1+img2来相加两幅图片。需要说明的是add()函数两个数相加如果大于255则结果就是255，而直接相加的会如果大于255则会把结果对255取模。

>>> x = np.uint8([250])
>>> y = np.uint8([10])

>>> print cv2.add(x,y) # 250+10 = 260 => 255
[[255]]

>>> print x+y          # 250+10 = 260 % 256 = 4
[4]

除了简单相加两幅图像，我们还能按比重去混合两幅图像，混合时按照以下公式：

$g(x) = (1 - \alpha)f_{0}(x) + \alpha f_{1}(x)$

把 $\alpha$ 从 $0 \rightarrow 1$ 调整，我们能看到从一幅图像慢慢变为另一副图像，cv2.addWeighted()按照以下公式来混合两幅图像：

$dst = \alpha \cdot img1 + \beta \cdot img2 + \gamma$

<span style="font-size:18px;">img1 = cv2.imread('ml.png')
img2 = cv2.imread('opencv_logo.jpg')

dst = cv2.addWeighted(img1,0.7,img2,0.3,0)

cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()</span>

效果如下：

Image Blending

另外OpenCV还支持对象素点的位运算(与或非和亦或)。这些运算方法在提取图片的非矩形区域时，能发挥意想不到的作用。

比如我想把上面的OpenCV的logo给抠下来放到另一张图片里去，如果之家吧两幅图片相加，那么颜色就会改变，如果混合两幅图片，则会造成透明的效果，这时就可以巧妙地运用为运算来解决这个问题：

# Load two images
img1 = cv2.imread('messi5.jpg')
img2 = cv2.imread('opencv_logo.png')

# I want to put logo on top-left corner, So I create a ROI
rows,cols,channels = img2.shape
roi = img1[0:rows, 0:cols ]

# Now create a mask of logo and create its inverse mask also
img2gray = cv2.cvtColor(img2,cv2.COLOR_BGR2GRAY)
ret, mask = cv2.threshold(img2gray, 10, 255, cv2.THRESH_BINARY)
mask_inv = cv2.bitwise_not(mask)

# Now black-out the area of logo in ROI
img1_bg = cv2.bitwise_and(roi,roi,mask = mask_inv)

# Take only region of logo from logo image.
img2_fg = cv2.bitwise_and(img2,img2,mask = mask)

# Put logo in ROI and modify the main image
dst = cv2.add(img1_bg,img2_fg)
img1[0:rows, 0:cols ] = dst

cv2.imshow('res',img1)
cv2.waitKey(0)
cv2.destroyAllWindows()

左图是mask的图像，右图是最后的结果。

这个程序要求logo必须是黑底的，它先用cvtColor把原图转换成灰度图，然后用threshold函数，根据灰度把图像分成了两部分——logo部分和背景部分，其中logo的灰度值为255(白色)，背景为0(黑色)，这就是mask图像。然后，对mask取反，让logo为0，背景为255，得到mask_inv图像。然后让messi5的左上角和它自身以mask_inv为掩码做与运算——即掩码为0，则结果得0，掩码大于0，则结果不变(这就在messi5上用黑色抠了一个logo，接下来要上色了)。再接着，让logo和它自身以mask为掩码做与运算(把有颜色的部分抠出来)。最后使用add函数把两个图片相加就得到了右图(这里用到了黑色是(0,0,0)，它加上什么颜色就是什么颜色这个特性)。

翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_image_arithmetics/py_image_arithmetics.html#image-arithmetics