Python-OpenCV教程-4

OpenCV版本要求在2.3.1以上

本文主要介绍OpenCV中对图像的基本操作和基本算法

1.基本操作

在Python环境下,我们有两种方式来操作图像——通过OpenCV提供的函数来操作图像或者是通过Numpy来直接修改图像的数组。这里,我们推荐使用Numpy的方式,应为它清晰并且高效。

首先我们读取一幅图像:

<span style="font-size:14px;">>>> import cv2
>>> import numpy as np

>>> img = cv2.imread('messi5.jpg')</span>

然后,我们可以直接通过行列坐标来访问这个像素的BGR值。对于灰度图像,则是访问它的灰度值。

>>> px = img[100,100]
>>> print px
[157 166 200]

# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print blue
157

然后通过这种方式也可以修改像素的值:

>>> img[100,100] = [255,255,255]
>>> print img[100,100]
[255 255 255]

但是,以上这种读取像素值的方式非常缓慢。因此,我们耿推荐使用Numpy的函数——array.item()和array.itemset()来访问。

以下是推荐的访问和修改方式:

# accessing RED value
>>> img.item(10,10,2)
59

# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100
除了访问图像的像素值,我们还能获取图像的属性——行数、列数、通道数、图像的数据类型以及像素点的数量等。

通过img.shape这个属性,我们可以得到一个记录了图像行数、列数和通道数的元组(灰度图像则只返回行列数,通过这个可以区分图像是彩色的还是灰度的)。

像素点的数量可以通过img.size这个函数获得,图像的数据类型可以通过img.dtype来获得:

>>> print img.shape
(342, 548, 3)
>>> print img.size
562248
>>> print img.dtype
uint8
有时,我们会经常对一幅图像的特定区域进行操作。比如我们要对一幅图像进行人眼检测,那么一般会先去检测人脸,然后在人脸的区域内去检测眼睛。这样做即提高的精度(因为眼睛总是长在脸上 : D),又提高了速度(搜索区域变小了)。

我们把这种特定区域的操作叫做ROI(region of image),下面的代码中,我们把图中的球复制到另一区域:

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball
效果如下:

Image ROI

有时我们还需要把图形的RGB通道分离,或者是把分离的三个通道合成成一幅RGB图像:

>>> b,g,r = cv2.split(img)
>>> img = cv2.merge((b,g,r))
或者

>>> b = img[:,:,0]
假设你想要把所有红色像素的值置为0:

>>> img[:,:,2] = 0
另外,cv2.split()函数运行非常消耗时间,所以在不必要的情况下最好别用。因此,我们更即推荐第二种方法。
最后,再介绍一个基本操作——边界填补(Padding)

在卷积计算、零点补偿等领域内,Padding有非常大的用处。Padding主要使用cv2.copyMakeBorder()这个函数,它需要的参数如下:

src:输入的图片

top,bottom,left,right:上下左右边界的宽度。

borderType:请参考英文页面

下面的代码显示了所有不同类型的边界:

import cv2
import numpy as np
from matplotlib import pyplot as plt

BLUE = [255,0,0]

img1 = cv2.imread('opencv_logo.png')

replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)

plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')

plt.show()
Border Types

翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_basic_ops/py_basic_ops.html#basic-ops

2.基本算法

我们可以通过cv2.add()函数或者是numpy的运算res=img1+img2来相加两幅图片。需要说明的是add()函数两个数相加如果大于255则结果就是255,而直接相加的会如果大于255则会把结果对255取模。

>>> x = np.uint8([250])
>>> y = np.uint8([10])

>>> print cv2.add(x,y) # 250+10 = 260 => 255
[[255]]

>>> print x+y          # 250+10 = 260 % 256 = 4
[4]
除了简单相加两幅图像,我们还能按比重去混合两幅图像,混合时按照以下公式:

g(x) = (1 - \alpha)f_{0}(x) + \alpha f_{1}(x)

\alpha0 \rightarrow 1调整,我们能看到从一幅图像慢慢变为另一副图像,cv2.addWeighted()按照以下公式来混合两幅图像:

dst = \alpha \cdot img1 + \beta \cdot img2 + \gamma

<span style="font-size:18px;">img1 = cv2.imread('ml.png')
img2 = cv2.imread('opencv_logo.jpg')

dst = cv2.addWeighted(img1,0.7,img2,0.3,0)

cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()</span>
效果如下

Image Blending

另外OpenCV还支持对象素点的位运算(与或非和亦或)。这些运算方法在提取图片的非矩形区域时,能发挥意想不到的作用。

比如我想把上面的OpenCV的logo给抠下来放到另一张图片里去,如果之家吧两幅图片相加,那么颜色就会改变,如果混合两幅图片,则会造成透明的效果,这时就可以巧妙地运用为运算来解决这个问题:

# Load two images
img1 = cv2.imread('messi5.jpg')
img2 = cv2.imread('opencv_logo.png')

# I want to put logo on top-left corner, So I create a ROI
rows,cols,channels = img2.shape
roi = img1[0:rows, 0:cols ]

# Now create a mask of logo and create its inverse mask also
img2gray = cv2.cvtColor(img2,cv2.COLOR_BGR2GRAY)
ret, mask = cv2.threshold(img2gray, 10, 255, cv2.THRESH_BINARY)
mask_inv = cv2.bitwise_not(mask)

# Now black-out the area of logo in ROI
img1_bg = cv2.bitwise_and(roi,roi,mask = mask_inv)

# Take only region of logo from logo image.
img2_fg = cv2.bitwise_and(img2,img2,mask = mask)

# Put logo in ROI and modify the main image
dst = cv2.add(img1_bg,img2_fg)
img1[0:rows, 0:cols ] = dst

cv2.imshow('res',img1)
cv2.waitKey(0)
cv2.destroyAllWindows()
Otsu's Thresholding
左图是mask的图像,右图是最后的结果。

这个程序要求logo必须是黑底的,它先用cvtColor把原图转换成灰度图,然后用threshold函数,根据灰度把图像分成了两部分——logo部分和背景部分,其中logo的灰度值为255(白色),背景为0(黑色),这就是mask图像。然后,对mask取反,让logo为0,背景为255,得到mask_inv图像。然后让messi5的左上角和它自身以mask_inv为掩码做与运算——即掩码为0,则结果得0,掩码大于0,则结果不变(这就在messi5上用黑色抠了一个logo,接下来要上色了)。再接着,让logo和它自身以mask为掩码做与运算(把有颜色的部分抠出来)。最后使用add函数把两个图片相加就得到了右图(这里用到了黑色是(0,0,0),它加上什么颜色就是什么颜色这个特性)。

翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_image_arithmetics/py_image_arithmetics.html#image-arithmetics


  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要进行相机标定的目的是为了去掉相机透镜畸变,使拍摄的图像更加准确,对于使用opencv库的python用户来讲,相机标定也是一项常规操作。以下是python-opencv相机标定的教程: 1. 收集标定图片:准备至少10到20张不同角度和位置的图片,要保证图片中有棋盘格子等模板。 2. 提取角点特征:用cv2.findChessboardCorners()函数提取棋盘格子的角点,这里用到的是cv2自带的提取工具。 3. 标定镜头:用cv2.calibrateCamera()函数对相机进行标定,得出相机内参矩阵等相关参数。 4. 存储标定结果: 使用cv2.FileStorage()函数存储标定参数。 5. 测试标定结果:使用cv2.undistort()函数果进行畸变校正,并观察校正后的图像是否有改善。 6. 应用标定结果:将标定结果应用到实际项目中,在程序中调用标定参数可以有效降低图像畸变,提高图像质量。 以上是python-opencv相机标定的教程,如果有需要的话,还可以使用均匀灰度图像等其他方式进行标定。通常情况下,一次标定的结果可以使用长时间,从而提高整个项目的精确度。 ### 回答2: Python-OpenCV相机标定教程是小型项目的标准。 在机器视觉和计算机视觉中,相机标定非常重要,这是获取全面、准确的数据的基础。相机标定的目的是为了减少照相机视角失真,提高拍摄到的图像质量,从而更好地支持照相机的图像处理。它的主要目的是矫正图像中的畸变并确定相机的内参和外参。 Python-OpenCV相机标定教程可以在Python编程语言中使用OpenCVPython库实现。这个过程包括多个步骤,如获取棋盘格角点、标定相机、计算相机的投影矩阵等。 在相机标定过程中,需要拍摄多张棋盘格图像。首先,必须定义棋盘格行列数量,然后手动测量棋盘格方格大小并加载图像到OpenCVPython中。接下来,寻找图像中棋盘格的角点,这些角点可以被处理以消除任何镜头失真。使用这些图像来标定相机并计算相机的投影矩阵。最后,保存相机内参和外参以对未来的图像应用重新计算。 相机标定的作用是消除由透视等导致的图像质量降低,从而使图像更清晰、更准确。Python-OpenCV相机标定教程为开发者提供了实现相机标定的基础,使他们可以快速构建照相机内参与外参算法并为数据处理提供基础。 ### 回答3: Python-OpenCV相机标定教程 OpenCV是一种非常流行的计算机视觉库,具有许多强大的功能,包括相机标定。相机标定是将相机的内部参数和畸变参数计算出来,以便更好地将2D图像转换为3D场景。在此教程中,我们将介绍使用Python-OpenCV库进行相机标定的步骤。 第一步:获取棋盘格图像 在进行相机标定之前,需要获取一些棋盘格图像。为了获得尽可能准确的结果,您需要将棋盘格图像从不同的角度和位置拍摄,并确保棋盘格图像足够清晰。我们建议至少拍摄10张不同的图像。 第二步:检测棋盘格角点 使用OpenCV中的函数cv2.findChessboardCorners()可以检测棋盘角点。它需要棋盘的大小和图像。如果检测到角点,函数将返回True,并将角点位置存储在一个数组中。 第三步:计算相机内部参数和畸变参数 为了计算相机的内部参数和畸变参数,需要使用OpenCV中的函数cv2.calibrateCamera()。这个函数接受一个由棋盘格图像和对应的角点位置组成的列表,并返回摄像机矩阵,畸变系数和旋转矩阵。 第四步:评估相机标定结果 在评估相机标定结果时,您需要计算误差,这可以通过一个简单的公式完成。误差是指每个棋盘格角点的图像坐标和标准(真实)坐标之间的平均距离。您还可以使用OpenCV可视化函数来显示标定结果。 总结 这就是使用Python-OpenCV进行相机标定的基本步骤。相机标定是一个基本任务,但是它对于实现更复杂的计算机视觉任务非常重要。标定成功后,您可以更准确地进行2D到3D坐标的变换,从而实现更准确的跟踪和测量。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值