注释:本文翻译自OpenCV3.0.0 document->OpenCV-Python Tutorials
1.OpenCV中的GUI特性
1.1从图像开始
1.1.1目标:
- 在这里,你会学习如何读取图像、显示图像并保存它
- 你会学习这些函数:cv2.imread()、cv2.imshow()、cv2.imwrite()
- 另外,你还会学习如何用Matplotlib显示图像
用cv2.imread()函数读取图像,第一个参数是图像所在路径,图像应该在工作目录中,或者应该给出图像的完整路径;
第二个参数是指定图像应该被读取的方式的标志.
- cv2.IMREAD_COLOR:加载彩色图像,任何图像的透明度都将被忽略。它是默认的标志
- cv2.IMREAD_GRAYSCALE :以灰度模式加载图像
- cv2.IMREAD_UNCHANGED:加载图像,包括alpha通道
示例代码:
import numpy as np
import cv2
#以灰度模式加载图像
img = cv2.imread('messi5.jpg',0)
1.1.2显示图像:
用函数cv2.imshow()在窗口显示图像,窗口大小自适应图像尺寸。函数的第一个参数是一个字符串窗口的名称,第二个参数是图像。可以根据需要创建多个窗口,但注意以不同名称命名。
cv2.imshow('image',img)
cv2.waitKey(0) #等待任意键按下
cv2.destroyAllWindows() #销毁所有窗口
cv2.waitKey()是一个键盘绑定函数,它的参数是以毫秒为单位的时间。该函数等待任何键盘事件指定的毫秒。如果在该时间按任意键,程序继续。如果0通过,那么它将无限期地等待一个关键的进程。当然也可以设置检测指定按键,如‘a’等。
cv2.destroyAllWindows()只是摧毁了我们创建的所有窗口。 如果要销毁任何特定的窗口,请使用函数cv2.destroyWindow(),将准确的窗口名称作为参数传递给函数。
cv2.namedWindow('image', cv2.WINDOW_NORMAL)
cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
1.1.3写图像:
用cv2.imwrite()保存图像,第一个参数是文件名称,第二个参数是想要保存的图像。
cv2.imwrite('messigray.png',img)
import numpy as np
import cv2
img = cv2.imread('messi5.jpg',0)
cv2.imshow('image',img)
k = cv2.waitKey(0) & 0xFF
if k == 27: # wait for ESC key to exit
cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
cv2.imwrite('messigray.png',img)
cv2.destroyAllWindows()
1.1.4使用Matplotlib:
Matplotlib是Python的绘图库,提供了各种绘图方法。 在这里,可以学习如何使用Matplotlib显示图像,还可以使用Matplotlib缩放图像,保存等。
代码示例:
import numpy as np
import cv2
from matplotlib import pyplot as plt
img = cv2.imread('messi5.jpg',0)
plt.imshow(img, cmap = 'gray', interpolation = 'bicubic')
plt.xticks([]), plt.yticks([]) # 隐藏x和y坐标上的刻度值
plt.show()
1.2从视频开始
1.2.1目标
- 学习阅读视频,显示视频并保存视频。
- 学习从相机捕获并显示它。
- 您将学习这些功能:cv2.VideoCapture(),cv2.VideoWriter()
1.2.2从相机捕获视频:
通常,我们必须用相机捕获直播。 OpenCV为此提供了一个非常简单的界面。 让我们从相机中拍摄一个视频(我正在使用笔记本电脑的内置网络摄像头),将其转换为灰度视频并显示。要捕获视频,需要创建一个VideoCapture对象。 其参数可以是设备索引或视频文件的名称。 设备索引只是指定哪个相机的数字。 通常一个相机将被连接(如我的情况)。 所以我只是通过0(或-1)。 您可以通过1选择第二台相机,依此类推。 之后,可以逐帧捕获。 但最后,别忘了释放捕获。
示例代码:
import numpy as np
import cv2
cap = cv2.VideoCapture(0)
while(True):
# 逐帧捕获
ret, frame = cap.read()
# 图像灰度化
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 显示结果
cv2.imshow('frame',gray)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
# 最后释放捕获
cap.release()
cv2.destroyAllWindows()
cap.read()返回一个bool(True / False)。 如果frame正确读取,则为True。 因此,您可以通过检查该返回值来查看是否到达视频的结尾。
有时候,cap可能没有初始化捕获。 在这种情况下,此代码显示错误。 您可以通过cap.isOpened()方法检查是否已初始化。 如果是True,OK。 否则使用cap.open()打开它。还可以使用cap.get(propId)方法访问此视频的一些功能,其中propId是从0到18的数字。每个数字表示视频的属性(如果适用于该视频)。 这些值中的一些可以使用cap.set(propId,value)进行修改。 价值是你想要的新价值。
例如,我可以通过cap.get(3)和cap.get(4)来检查帧宽度和高度。 默认情况下给我640x480。 但是我想将其修改为320x240。 只需使用ret = cap.set(3,320)和ret = cap.set(4,240)。
1.2.3 从文件播放视频
与Camera相似,只需用摄像机名称更改摄像机索引。 同时显示帧时,请使用适当的时间为cv2.waitKey()。 如果它太少,视频将非常快,如果它太高,视频将会慢(那就是如何以慢动作显示视频)。 一般情况下25毫秒都可以。
示例代码:
import numpy as np
import cv2
cap = cv2.VideoCapture('vtest.avi')
while(cap.isOpened()):
ret, frame = cap.read()
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imshow('frame',gray)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
注意:确保安装了正确的ffmpeg或gstreamer版本。 有时候,由于ffmpeg / gstreamer的安装错误,使用视频捕获技术很麻烦。
1.2.4 保存视频
所以我们拍摄一个视频,逐帧处理,我们想保存该视频。对于图像,它非常简单,只需使用cv2.imwrite()。这里需要更多的工作。这次我们创建一个VideoWriter对象。我们应该指定输出文件名(例如:output.avi)。那么我们应该指定FourCC代码(下一段的细节)。那么应该传递每秒帧数(fps)和帧大小。最后一个是isColor标志。如果为True,编码器需要色框,否则可以使用灰度帧。
FourCC是用于指定视频编解码器的4字节代码。可用的代码列表可以在fourcc.org中找到。
在Fedora:DIVX,XVID,MJPG,X264,WMV1,WMV2。 (XVID是更优选的,MJPG导致高尺寸视频,X264提供非常小的视频)
在Windows中:DIVX(更多待测试和添加)
FourCC代码作为MvPV传递为cv2.VideoWriter_fourcc('M','J','P','G')或cv2.VideoWriter_fourcc(*'MJPG)。
下面的代码从摄像机捕获,在垂直方向上翻转每一帧并保存。
import numpy as np
import cv2
cap = cv2.VideoCapture(0)
# Define the codec and create VideoWriter object
fourcc = cv2.VideoWriter_fourcc(*'XVID')
out = cv2.VideoWriter('output.avi',fourcc, 20.0, (640,480))
while(cap.isOpened()):
ret, frame = cap.read()
if ret==True:
frame = cv2.flip(frame,0)
# write the flipped frame
out.write(frame)
cv2.imshow('frame',frame)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
else:
break
# Release everything if job is finished
cap.release()
out.release()
cv2.destroyAllWindows()
1.3OpenCV中的绘图函数
1.3.1 目标
- 使用OpenCV绘制不同的几何形状
- 学习这些函数:cv2.line()、cv2。circle()、cv2.rectangle()、cv2.ellipse()、cv2.putText()等
- img:要绘制形状的图像
- 颜色:形状的颜色。 对于BGR,将其作为元组传递,例如:(255,0,0)为蓝色。 对于灰度,只需传递标量值。
- 厚度:线或圆的厚度等。如果为了封闭图形,如圆形通过-1,它将填充形状。 默认厚度= 1
- lineType:线路类型,无论是8连接,抗锯齿线路等。默认情况下,它是8连接的。 cv2.LINE_AA给出了对于曲线看起来不错的反锯齿线。
1.3.2 画线
要画一条线,需要知道线的起始和结束坐标。下面的例子将创建一个黑色图像,并从左上上角到右下角创建一条蓝线。
import numpy as np
import cv2
# 创建一个黑色图像
img = np.zeros((512,512,3), np.uint8)
#画一个对角蓝线,厚度为5像素
cv2.line(img,(0,0),(511,511),(255,0,0),5)
1.3.3 画矩形
要绘制一个矩形,需要知道矩形左上角和右下角的坐标。下面的例子会在图像的右上角画一个绿色的矩形。cv2.rectangle(img,(384,0),(510,128),(0,255,0),3)
1.3.4 画圆
要画一个圆,需要它的中心坐标和半径。 我们将在上面绘制的矩形中画一个圆。
cv2.circle(img,(447,63), 63, (0,0,255), -1)
1.3.5 画椭圆
要画椭圆,我们需要传递几个参数。 一个参数是中心位置(x,y)。 下一个参数是轴长度(长轴长度,短轴长度)。 角度是逆时针方向的椭圆的旋转角度。 startAngle和endAngle表示从长轴沿顺时针方向测量的椭圆弧的开始和结束。 即给出值0和360给出完整的椭圆。 有关更多详细信息,请查看cv2.ellipse()的文档。 以下示例在图像的中心绘制一个半椭圆。
cv2.ellipse(img,(256,256),(100,50),0,0,180,255,-1)
1.3.6 绘制多边形
要绘制多边形,首先需要顶点坐标。将这些点放入Rows*1*2的矩阵中,其中Rows是定点数,它应该是int32类型。这里我们用黄色的四个定点绘制一个小的多边形。
pts = np.array([[10,5],[20,30],[70,20],[50,10]], np.int32)
pts = pts.reshape((-1,1,2))
cv2.polylines(img,[pts],True,(0,255,255))
注意:如果第三个参数是False,绘制的图像将是一条折现连接所有的点,而不是一个封闭的形状。
注意:cv2.polylines()可以用来绘制多行。 只需创建一个要绘制的所有行的列表,并将其传递给该函数。 所有行将单独绘制。 为每一行调用cv2.line(),绘制一组线是一个更好和更快的方式。
1.3.7 给图像添加文本
要将图像放在图像中,您需要指定以下内容:
我们将在图像上用白色写OpenCV。
- 要写入的文本数据
- 要放置的位置坐标(即数据开始的左下角)。
- 字体类型(支持支持字体的cv2.putText()文档)
- 字体缩放(指定字体大小)
我们将在图像上用白色写OpenCV。
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img,'OpenCV',(10,500), font, 4,(255,255,255),2,cv2.LINE_AA)
1.4 鼠标作为笔刷
1.4.1 目标
- 学习OpenCV中的鼠标处理事件
- 学习这些函数:cv2.setMouseCallback()
1.4.2 小demo
在这里,我们创建一个简单的应用程序,在双击的时候上绘制一个圆圈。
首先我们创建一个鼠标回调函数,该函数在鼠标事件发生时执行。 鼠标事件可以与鼠标相关,如左按钮,左键,左键双击等。它给出了每个鼠标事件的坐标(x,y)。 有了这个事件和位置,我们可以做任何我们喜欢的事情。
首先我们创建一个鼠标回调函数,该函数在鼠标事件发生时执行。 鼠标事件可以与鼠标相关,如左按钮,左键,左键双击等。它给出了每个鼠标事件的坐标(x,y)。 有了这个事件和位置,我们可以做任何我们喜欢的事情。
创建鼠标回调函数具有特定格式。 它只是根据函数的有所不同。这里我们的鼠标回调函数做一件事,它画一个圆,我们双击。 所以看下面的代码就不言自明了:
import cv2
import numpy as np
# 鼠标回调函数
def draw_circle(event,x,y,flags,param):
if event == cv2.EVENT_LBUTTONDBLCLK:
cv2.circle(img,(x,y),100,(255,0,0),-1)
# 创建一个黑色图像,并绑定窗口和鼠标回调函数
img = np.zeros((512,512,3), np.uint8)
cv2.namedWindow('image')
cv2.setMouseCallback('image',draw_circle)
while(1):
cv2.imshow('image',img)
if cv2.waitKey(20) & 0xFF == 27:
break
cv2.destroyAllWindows()
1.4.3 更高级的demo
现在我们去做一个更复杂的应用程序。 在这里,我们绘制矩形或圆形(取决于我们选择的模式),通过像Paint应用程序一样拖动鼠标。 所以我们的鼠标回调函数有两个部分,一个是绘制矩形和另一个画圆的。 这个具体的例子将有助于创建和理解一些交互式应用程序,如对象跟踪,图像分割等。
接下来,将这个鼠标回调函数draw_circles绑定到OpenCV窗口。 在主循环中,我们应该设置键“m”的键盘绑定,以在矩形和圆形之间切换。
#根据鼠标点击事件花绿色的矩形或者画红色的圆
#用m键切换模式,默认是画矩形,按下ESC键退出
import cv2
import numpy as np
drawing=False #true if mouse is pressed
mode=True #if true, draw a rectangle. Press 'm' to toggle to curve
ix,iy=-1,-1
#mouse callback function
def draw_circle(event,x,y,flags,param):
global ix,iy,drawing,mode
if event==cv2.EVENT_LBUTTONDOWN:
drawing==True
ix,iy=x,y
elif event==cv2.EVENT_MOUSEMOVE:
if drawing==True:
if mode==True:
cv2.rectangle(img,(ix,iy),(x,y),(0,255,0),-1)
else:
cv2.circle(img,(x,y),50,(0,0,255),-1)
elif event==cv2.EVENT_LBUTTONUP:
drawing=False
if mode==True:
cv2.rectangle(img,(ix,iy),(x,y),(0,255,0),-1)
else:
cv2.circle(img,(x,y),50,(0,0,255),-1)
#Next we have to bind this mouse callback function to OpenCV Window.
#In the main loop,we should set a keyboard binding for key'm' to toggle between
#rectangle and circle
img=np.zeros((512,512,3),np.uint8);
cv2.namedWindow('image')
cv2.setMouseCallback('image',draw_circle)
while(1):
cv2.imshow('image',img)
k=cv2.waitKey(1)&0xFF
if k==ord('m'):
mode=not mode
elif k==27:
break
cv2.destroyAllWindows()
结果:
1.5 将滑动条作为调色板
1.5.1 目标
- 学习将Trackbar绑定到OpenCV窗口
- 将学习这些函数:cv2.getTrackbarPos(),cv2.createTrackbar()等
1.5.2 代码示例
这里我们将创建一个简单的应用程序,显示您指定的颜色。程旭会显示一个窗口,颜色显示面板和三个滑动条,以指定B,G,R颜色中的每一个。滑动轨迹栏会导致窗口颜色变化。默认情况下,初始颜色将设置为黑色。
对于cv2.getTrackbarPos()函数,第一个参数是滑动条名称,第二个参数是附加的窗口名称,第三个参数是默认值,第四个参数是最大值,第五个是执行的回调函数,每次跟踪滑动条值都会发生变化。回调函数始终具有即跟踪栏位置的默认参数值,。在我们的示例中,函数什么都不做,所以只是跳过。
轨道栏的另一个重要应用是将其用作按钮或开关。默认情况下,OpenCV没有按钮功能。所以你可以使用trackbar获得这样的功能。在我们的应用程序中,我们已经创建了一个开关,其中应用程序仅在开关为ON时工作,否则屏幕始终为黑色。
对于cv2.getTrackbarPos()函数,第一个参数是滑动条名称,第二个参数是附加的窗口名称,第三个参数是默认值,第四个参数是最大值,第五个是执行的回调函数,每次跟踪滑动条值都会发生变化。回调函数始终具有即跟踪栏位置的默认参数值,。在我们的示例中,函数什么都不做,所以只是跳过。
轨道栏的另一个重要应用是将其用作按钮或开关。默认情况下,OpenCV没有按钮功能。所以你可以使用trackbar获得这样的功能。在我们的应用程序中,我们已经创建了一个开关,其中应用程序仅在开关为ON时工作,否则屏幕始终为黑色。
代码:
import cv2
import numpy as np
def nothing(x):
pass
#create a black image,a window
img=np.zeros((300,512,3),np.uint8)
cv2.namedWindow('image')
#create trackbars for color change
cv2.createTrackbar('R','image',0,255,nothing)
cv2.createTrackbar('G','image',0,255,nothing)
cv2.createTrackbar('B','image',0,255,nothing)
#create trackbar for ON/OFF functonality
switch='0:OFF\n1:ON'
cv2.createTrackbar(switch,'image',0,1,nothing)
#按下ESC键程序退出
while(1):
cv2.imshow('image',img)
k=cv2.waitKey(1)&0xFF
if k==27:
break
#get current positions of four trackbars
r=cv2.getTrackbarPos('R','image')
g=cv2.getTrackbarPos('G','image')
b=cv2.getTrackbarPos('B','image')
s=cv2.getTrackbarPos(switch,'image')
if s==0:
img[:]=0
else:
img[:]=[b,g,r]
cv2.destroyAllWindows()
结果: