OpenCV教程3(python)

OpenCV教程3(python)

图像的基础操作

这里虽然题目是图像的基础操作,下面也是关于一些图像的像素操作,但其实在OpenCV3中,图像用的是numpy里的ndarray类型存储的,所以这里的一些操作与numpy联系更密切一点。在OpenCV中最常用的图像有RGB图像(彩色)和灰度图(包括二值图)。
RGB图像是一个长*宽*3的array类型数组,例如:
RGB图
这是一个2*2的彩色图片,它的array数组是:
[
[ [0,0,255],[0,0,0] ],
[ [255,0,0],[0,255,0] ]
]
灰度图只一个长*宽的array类型的数组,它不像彩色图有RGB三通道,灰度图只有一个单通道,表示灰度,范围是[0-255],0表示灰度最大,为黑色,255表示灰度最小,为白色。例如:
灰度图
这是一个2*2的灰度图片,它的array数组是:
[
[ 80, 0 ],
[ 199,120 ]
]

1.获取并修改像素值

这里我们以彩色RGB图像为例,讲述获取和修改像素值。
首先我们要读入一幅图像

import cv2
import numpy as np
img=cv2.imread(r'opencv_logo.jpg')
cv2.imshow('logo',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

opencv_logo.jpg图片链接

运行结果如下:
opencv_logo
这里显示的是OpenCV的大logo,接下来让我们试着操作图片中的像素吧。

pixel1=img[200,200]
print(pixel1)
pixel2_blue=img[200,200,0]
print(pixel2_blue)

将上面的代码复制到一开始写的代码中。
输出结果:
输出结果
注意:有些IDE中可能没有显示出输出结果,这时需要去掉代码的后三行。

cv2.imread返回的就是一个array数组,对RGB图像来讲,对本例子来讲,是个300*312*3的数组。img[200,200],索引第一个数字表示行,第二个数字表示列,返回200行,200列处的像素值,是个3通道的值;img[200,200,0],前两个数字一样,最后一个0表示三通道中的第一个蓝色通道的值(OpenCV彩色图像是用BGR形式表示的,这里需要注意一下)。

同样,我们也可修改像素值,

img[200,200] = [0,255,0]
#img[200,200,0] = [0],这行注释掉,之后将上面一行注释掉,运行这一行

运行一下程序:
运行结果
同学们可能注意到蓝色弧形那边有一个小点颜色被改变了,仔细看!

如果是获取和修改单通道的值,推荐另外一种写法:

print(img.item(200,200,2)) #获取单通道的值
img.itemset((200,200,2),100) #修改单通道的值

注意:img.item和img.itemset只能获取和修改RGB单通道的值,或者灰度图的值。

这可能不明显,接下来让我们大面积的修改颜色吧。

img[180:220,180:220] = [0,255,0]

结果:
结果
这下明显多了。这里用到了python中切片的概念,不懂得同学可以看看python和numpy的简单教程。这里修改了180-220行和180-220列这样一个矩形方块的颜色,将它设为绿色。

2.获取图像的属性
import cv2
import numpy as np
img=cv2.imread(r'opencv_logo.jpg')
print(img.shape)
#输出(300,312,3)
print(img.size)
#输出280800
print(img.dtype)
#输出uint8

img.shape 可以获取图像的形状。返回值是一个包含行数,列数,通道数的元组。灰度图只返回行数,列数这样一个元组。所以可以用这个来判断图片类型,是彩色图还是灰度图。

img.size返回图像array数组总的元素个数,对于彩色三通道图,就是行数*列数*3,对于灰度图就是行数*列数。

img.dtype返回图像的数据类型,也就是array数组的数据类型。

3.拆分及合并图像通道

有时需要对 BGR 三个通道分别进行操作。这时需要把 BGR 拆分成单个通道。有时需要把独立通道的图片合并成一个 BGR 图像。

import cv2
import numpy as np
img=cv2.imread(r'opencv_logo.jpg')
b,g,r=cv2.split(img)
img=cv2.merge([b,g,r])

cv2.split(img)返回b,g,r通道,cv2.merge([b,g,r])合并b,g,r通道。
上述两个方法属于OpenCV里的方法,比较耗时,建议直接使用numpy索引比较快。
例如:b=img[:,:,0]

4.总结

上面对图像的操作,其实本质就是对numpy.array操作,所以读者需要熟悉一下numpy库的一些简单操作。

下一节主要讲一下图像上的一些算法操作。

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenCV是一个开源的计算机视觉库,提供了丰富的图像处理和计算机视觉算法。下面是一个简单的OpenCV入门教程Python版本): 1. 安装OpenCV库:首先,你需要安装OpenCV库。可以使用pip命令在命令中执以下命令进安装: ``` pip install opencv-python ``` 2. 导入OpenCV库:在Python脚本中,你需要导入OpenCV库才能使用其中的函数和类。可以使用以下代码导入OpenCV库: ```python import cv2 ``` 3. 读和显示图像:使用OpenCV可以轻松读和显示图像。以下是一个读和显示图像的示例代码: ```python # 读图像 image = cv2.imread('image.jpg') # 显示图像 cv2.imshow('Image', image) cv2.waitKey(0) cv2.destroyAllWindows() ``` 4. 图像处理OpenCV提供了许多图像处理函数,可以对图像各种操作,如调整大小、裁剪、旋转、滤波等。以下是一个简单的图像处理示例代码: ```python # 调整图像大小 resized_image = cv2.resize(image, (new_width, new_height)) # 裁剪图像 cropped_image = image[y:y+h, x:x+w] # 旋转图像 rotated_image = cv2.rotate(image, cv2.ROTATE_90_CLOCKWISE) # 图像滤波 blurred_image = cv2.GaussianBlur(image, (kernel_size, kernel_size), 0) ``` 5. 视频处理:除了图像处理OpenCV还可以处理视频。以下是一个简单的视频处理示例代码: ```python # 打开视频文件 video = cv2.VideoCapture('video.mp4') while True: # 读视频帧 ret, frame = video.read() if not ret: break # 显示视频帧 cv2.imshow('Video', frame) # 按下 'q' 键退出循环 if cv2.waitKey(1) & 0xFF == ord('q'): break # 释放视频对象和关闭窗口 video.release() cv2.destroyAllWindows() ``` 这只是OpenCV的入门教程的一小部分,OpenCV还有很多其他功能和应用。你可以通过阅读OpenCV官方文档和参考其他教程来深入学习和探索OpenCV的更多功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值