(一)OpenCV中的GUI特性

最新推荐文章于 2025-01-20 15:00:02 发布

sosi酱

最新推荐文章于 2025-01-20 15:00:02 发布

阅读量4.4k

点赞数 2

分类专栏： python 文章标签： python opencv

python 专栏收录该内容

24 篇文章

订阅专栏

注释：本文翻译自OpenCV3.0.0 document->OpenCV-Python Tutorials

1.OpenCV中的GUI特性

1.1从图像开始

1.1.1目标：

在这里，你会学习如何读取图像、显示图像并保存它
你会学习这些函数：cv2.imread()、cv2.imshow()、cv2.imwrite()
另外，你还会学习如何用Matplotlib显示图像

读取图像：

用cv2.imread()函数读取图像，第一个参数是图像所在路径，图像应该在工作目录中，或者应该给出图像的完整路径；

第二个参数是指定图像应该被读取的方式的标志.

cv2.IMREAD_COLOR：加载彩色图像，任何图像的透明度都将被忽略。它是默认的标志
cv2.IMREAD_GRAYSCALE ：以灰度模式加载图像
cv2.IMREAD_UNCHANGED：加载图像，包括alpha通道

备注：以上三个flag，也可以分别用1，0，-1代替

示例代码：

import numpy as np
import cv2

#以灰度模式加载图像
img = cv2.imread('messi5.jpg',0)

1.1.2显示图像：

用函数cv2.imshow()在窗口显示图像，窗口大小自适应图像尺寸。函数的第一个参数是一个字符串窗口的名称，第二个参数是图像。可以根据需要创建多个窗口，但注意以不同名称命名。

cv2.imshow('image',img)
cv2.waitKey(0)   #等待任意键按下
cv2.destroyAllWindows()  #销毁所有窗口

cv2.waitKey()是一个键盘绑定函数，它的参数是以毫秒为单位的时间。该函数等待任何键盘事件指定的毫秒。如果在该时间按任意键，程序继续。如果0通过，那么它将无限期地等待一个关键的进程。当然也可以设置检测指定按键，如‘a’等。

cv2.destroyAllWindows（）只是摧毁了我们创建的所有窗口。如果要销毁任何特定的窗口，请使用函数cv2.destroyWindow（），将准确的窗口名称作为参数传递给函数。

备注:注意有一种特殊情况，可以在此创建一个窗口并稍后加载图像。在这种情况下，可以是否可调整指定窗口大小。它使用函数cv2.namedWindow（）完成。默认情况下，该标志是cv2.WINDOW_AUTOSIZE。但是如果指定标志为cv2.WINDOW_NORMAL，则可以调整窗口大小。当图像的尺寸太大并且向窗口添加轨迹栏时，是可以的。

cv2.namedWindow('image', cv2.WINDOW_NORMAL)
cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.1.3写图像：

用cv2.imwrite()保存图像，第一个参数是文件名称，第二个参数是想要保存的图像。

cv2.imwrite('messigray.png',img)

总结：下面这个例子会以.PNG格式保存图像到工作空间

import numpy as np
import cv2

img = cv2.imread('messi5.jpg',0)
cv2.imshow('image',img)
k = cv2.waitKey(0) & 0xFF
if k == 27:         # wait for ESC key to exit
    cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
    cv2.imwrite('messigray.png',img)
    cv2.destroyAllWindows()

1.1.4使用Matplotlib：

Matplotlib是Python的绘图库，提供了各种绘图方法。在这里，可以学习如何使用Matplotlib显示图像，还可以使用Matplotlib缩放图像，保存等。

代码示例：

import numpy as np
import cv2
from matplotlib import pyplot as plt

img = cv2.imread('messi5.jpg',0)
plt.imshow(img, cmap = 'gray', interpolation = 'bicubic')
plt.xticks([]), plt.yticks([])  # 隐藏x和y坐标上的刻度值
plt.show()

注意：OpenCV加载的彩色图像为BGR模式。但Matplotlib以RGB模式显示。因此，如果使用OpenCV读取图像，则Matplotlib中的彩色图像将无法正确显示。可参考Matplotlib官方文档。

1.2从视频开始

1.2.1目标

学习阅读视频，显示视频并保存视频。
学习从相机捕获并显示它。
您将学习这些功能：cv2.VideoCapture（），cv2.VideoWriter（）

1.2.2从相机捕获视频：

通常，我们必须用相机捕获直播。 OpenCV为此提供了一个非常简单的界面。让我们从相机中拍摄一个视频（我正在使用笔记本电脑的内置网络摄像头），将其转换为灰度视频并显示。
要捕获视频，需要创建一个VideoCapture对象。其参数可以是设备索引或视频文件的名称。设备索引只是指定哪个相机的数字。通常一个相机将被连接（如我的情况）。所以我只是通过0（或-1）。您可以通过1选择第二台相机，依此类推。之后，可以逐帧捕获。但最后，别忘了释放捕获。

示例代码：

import numpy as np
import cv2

cap = cv2.VideoCapture(0)

while(True):
    # 逐帧捕获
    ret, frame = cap.read()

    # 图像灰度化
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # 显示结果
    cv2.imshow('frame',gray)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 最后释放捕获
cap.release()
cv2.destroyAllWindows()

cap.read（）返回一个bool（True / False）。如果frame正确读取，则为True。因此，您可以通过检查该返回值来查看是否到达视频的结尾。

有时候，cap可能没有初始化捕获。在这种情况下，此代码显示错误。您可以通过cap.isOpened（）方法检查是否已初始化。如果是True，OK。否则使用cap.open（）打开它。还可以使用cap.get（propId）方法访问此视频的一些功能，其中propId是从0到18的数字。每个数字表示视频的属性（如果适用于该视频）。这些值中的一些可以使用cap.set（propId，value）进行修改。价值是你想要的新价值。
例如，我可以通过cap.get（3）和cap.get（4）来检查帧宽度和高度。默认情况下给我640x480。但是我想将其修改为320x240。只需使用ret = cap.set（3,320）和ret = cap.set（4,240）。

1.2.3 从文件播放视频

与Camera相似，只需用摄像机名称更改摄像机索引。同时显示帧时，请使用适当的时间为cv2.waitKey（）。如果它太少，视频将非常快，如果它太高，视频将会慢（那就是如何以慢动作显示视频）。一般情况下25毫秒都可以。

示例代码：

import numpy as np
import cv2

cap = cv2.VideoCapture('vtest.avi')

while(cap.isOpened()):
    ret, frame = cap.read()

    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame',gray)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

注意：确保安装了正确的ffmpeg或gstreamer版本。有时候，由于ffmpeg / gstreamer的安装错误，使用视频捕获技术很麻烦。

1.2.4 保存视频

所以我们拍摄一个视频，逐帧处理，我们想保存该视频。对于图像，它非常简单，只需使用cv2.imwrite（）。这里需要更多的工作。
这次我们创建一个VideoWriter对象。我们应该指定输出文件名（例如：output.avi）。那么我们应该指定FourCC代码（下一段的细节）。那么应该传递每秒帧数（fps）和帧大小。最后一个是isColor标志。如果为True，编码器需要色框，否则可以使用灰度帧。

FourCC是用于指定视频编解码器的4字节代码。可用的代码列表可以在fourcc.org中找到。

在Fedora：DIVX，XVID，MJPG，X264，WMV1，WMV2。（XVID是更优选的，MJPG导致高尺寸视频，X264提供非常小的视频）
在Windows中：DIVX（更多待测试和添加）
FourCC代码作为MvPV传递为cv2.VideoWriter_fourcc（'M'，'J'，'P'，'G'）或cv2.VideoWriter_fourcc（*'MJPG）。

下面的代码从摄像机捕获，在垂直方向上翻转每一帧并保存。

import numpy as np
import cv2

cap = cv2.VideoCapture(0)

# Define the codec and create VideoWriter object
fourcc = cv2.VideoWriter_fourcc(*'XVID')
out = cv2.VideoWriter('output.avi',fourcc, 20.0, (640,480))

while(cap.isOpened()):
    ret, frame = cap.read()
    if ret==True:
        frame = cv2.flip(frame,0)

        # write the flipped frame
        out.write(frame)

        cv2.imshow('frame',frame)
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

# Release everything if job is finished
cap.release()
out.release()
cv2.destroyAllWindows()

1.3OpenCV中的绘图函数

1.3.1 目标

使用OpenCV绘制不同的几何形状
学习这些函数：cv2.line()、cv2。circle()、cv2.rectangle()、cv2.ellipse()、cv2.putText()等

在所有上述函数中，将看到一些常见的参数如下：

img：要绘制形状的图像
颜色：形状的颜色。对于BGR，将其作为元组传递，例如：（255,0,0）为蓝色。对于灰度，只需传递标量值。
厚度：线或圆的厚度等。如果为了封闭图形，如圆形通过-1，它将填充形状。默认厚度= 1
lineType：线路类型，无论是8连接，抗锯齿线路等。默认情况下，它是8连接的。 cv2.LINE_AA给出了对于曲线看起来不错的反锯齿线。

1.3.2 画线

要画一条线，需要知道线的起始和结束坐标。下面的例子将创建一个黑色图像，并从左上上角到右下角创建一条蓝线。

import numpy as np
import cv2

# 创建一个黑色图像
img = np.zeros((512,512,3), np.uint8)

#画一个对角蓝线，厚度为5像素
cv2.line(img,(0,0),(511,511),(255,0,0),5)

1.3.3 画矩形

要绘制一个矩形，需要知道矩形左上角和右下角的坐标。下面的例子会在图像的右上角画一个绿色的矩形。

cv2.rectangle(img,(384,0),(510,128),(0,255,0),3)

1.3.4 画圆

要画一个圆，需要它的中心坐标和半径。我们将在上面绘制的矩形中画一个圆。

cv2.circle(img,(447,63), 63, (0,0,255), -1)

1.3.5 画椭圆

要画椭圆，我们需要传递几个参数。一个参数是中心位置（x，y）。下一个参数是轴长度（长轴长度，短轴长度）。角度是逆时针方向的椭圆的旋转角度。 startAngle和endAngle表示从长轴沿顺时针方向测量的椭圆弧的开始和结束。即给出值0和360给出完整的椭圆。有关更多详细信息，请查看cv2.ellipse（）的文档。以下示例在图像的中心绘制一个半椭圆。

cv2.ellipse(img,(256,256),(100,50),0,0,180,255,-1)

1.3.6 绘制多边形

要绘制多边形，首先需要顶点坐标。将这些点放入Rows*1*2的矩阵中，其中Rows是定点数，它应该是int32类型。这里我们用黄色的四个定点绘制一个小的多边形。

pts = np.array([[10,5],[20,30],[70,20],[50,10]], np.int32)
pts = pts.reshape((-1,1,2))
cv2.polylines(img,[pts],True,(0,255,255))

注意：如果第三个参数是False，绘制的图像将是一条折现连接所有的点，而不是一个封闭的形状。

注意：cv2.polylines（）可以用来绘制多行。只需创建一个要绘制的所有行的列表，并将其传递给该函数。所有行将单独绘制。为每一行调用cv2.line（），绘制一组线是一个更好和更快的方式。

1.3.7 给图像添加文本

要将图像放在图像中，您需要指定以下内容：

要写入的文本数据
要放置的位置坐标（即数据开始的左下角）。
字体类型（支持支持字体的cv2.putText（）文档）
字体缩放（指定字体大小）

其他的参数，如颜色，厚度，lineType等。为了更好看，lineType = cv2.LINE_AA是推荐的。
我们将在图像上用白色写OpenCV。

font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img,'OpenCV',(10,500), font, 4,(255,255,255),2,cv2.LINE_AA)

1.4 鼠标作为笔刷

1.4.1 目标

学习OpenCV中的鼠标处理事件
学习这些函数：cv2.setMouseCallback（）

1.4.2 小demo

在这里，我们创建一个简单的应用程序，在双击的时候上绘制一个圆圈。
首先我们创建一个鼠标回调函数，该函数在鼠标事件发生时执行。鼠标事件可以与鼠标相关，如左按钮，左键，左键双击等。它给出了每个鼠标事件的坐标（x，y）。有了这个事件和位置，我们可以做任何我们喜欢的事情。

创建鼠标回调函数具有特定格式。它只是根据函数的有所不同。这里我们的鼠标回调函数做一件事，它画一个圆，我们双击。所以看下面的代码就不言自明了：

import cv2
import numpy as np

# 鼠标回调函数
def draw_circle(event,x,y,flags,param):
    if event == cv2.EVENT_LBUTTONDBLCLK:
        cv2.circle(img,(x,y),100,(255,0,0),-1)

# 创建一个黑色图像，并绑定窗口和鼠标回调函数
img = np.zeros((512,512,3), np.uint8)
cv2.namedWindow('image')
cv2.setMouseCallback('image',draw_circle)

while(1):
    cv2.imshow('image',img)
    if cv2.waitKey(20) & 0xFF == 27:
        break
cv2.destroyAllWindows()

1.4.3 更高级的demo

现在我们去做一个更复杂的应用程序。在这里，我们绘制矩形或圆形（取决于我们选择的模式），通过像Paint应用程序一样拖动鼠标。所以我们的鼠标回调函数有两个部分，一个是绘制矩形和另一个画圆的。这个具体的例子将有助于创建和理解一些交互式应用程序，如对象跟踪，图像分割等。

接下来，将这个鼠标回调函数draw_circles绑定到OpenCV窗口。在主循环中，我们应该设置键“m”的键盘绑定，以在矩形和圆形之间切换。

#根据鼠标点击事件花绿色的矩形或者画红色的圆
#用m键切换模式，默认是画矩形，按下ESC键退出
import cv2
import numpy as np

drawing=False #true if mouse is pressed
mode=True #if true, draw a rectangle. Press 'm' to toggle to curve
ix,iy=-1,-1

#mouse callback function

def draw_circle(event,x,y,flags,param):
    global ix,iy,drawing,mode

    if event==cv2.EVENT_LBUTTONDOWN:
        drawing==True
        ix,iy=x,y
    elif event==cv2.EVENT_MOUSEMOVE:
        if drawing==True:
            if mode==True:
                cv2.rectangle(img,(ix,iy),(x,y),(0,255,0),-1)
            else:
                cv2.circle(img,(x,y),50,(0,0,255),-1)

    elif event==cv2.EVENT_LBUTTONUP:
        drawing=False
        if mode==True:
            cv2.rectangle(img,(ix,iy),(x,y),(0,255,0),-1)
        else:
            cv2.circle(img,(x,y),50,(0,0,255),-1)


#Next we have to bind this  mouse callback function to OpenCV Window.
#In the main loop,we should set a keyboard binding for key'm' to toggle between
#rectangle and circle

img=np.zeros((512,512,3),np.uint8);
cv2.namedWindow('image')
cv2.setMouseCallback('image',draw_circle)

while(1):
    cv2.imshow('image',img)
    k=cv2.waitKey(1)&0xFF
    if k==ord('m'):
        mode=not mode
    elif k==27:
        break

cv2.destroyAllWindows()

结果：

1.5 将滑动条作为调色板

1.5.1 目标

学习将Trackbar绑定到OpenCV窗口
将学习这些函数：cv2.getTrackbarPos（），cv2.createTrackbar（）等

1.5.2 代码示例

这里我们将创建一个简单的应用程序，显示您指定的颜色。程旭会显示一个窗口，颜色显示面板和三个滑动条，以指定B，G，R颜色中的每一个。滑动轨迹栏会导致窗口颜色变化。默认情况下，初始颜色将设置为黑色。
对于cv2.getTrackbarPos（）函数，第一个参数是滑动条名称，第二个参数是附加的窗口名称，第三个参数是默认值，第四个参数是最大值，第五个是执行的回调函数，每次跟踪滑动条值都会发生变化。回调函数始终具有即跟踪栏位置的默认参数值，。在我们的示例中，函数什么都不做，所以只是跳过。
轨道栏的另一个重要应用是将其用作按钮或开关。默认情况下，OpenCV没有按钮功能。所以你可以使用trackbar获得这样的功能。在我们的应用程序中，我们已经创建了一个开关，其中应用程序仅在开关为ON时工作，否则屏幕始终为黑色。

代码：

import cv2
import numpy as np

def nothing(x):
    pass

#create a black image,a window
img=np.zeros((300,512,3),np.uint8)
cv2.namedWindow('image')

#create trackbars for color change
cv2.createTrackbar('R','image',0,255,nothing)
cv2.createTrackbar('G','image',0,255,nothing)
cv2.createTrackbar('B','image',0,255,nothing)

#create trackbar for ON/OFF functonality
switch='0:OFF\n1:ON'
cv2.createTrackbar(switch,'image',0,1,nothing)

#按下ESC键程序退出
while(1):
    cv2.imshow('image',img)
    k=cv2.waitKey(1)&0xFF
    if k==27:
        break

    #get current positions of four trackbars
    r=cv2.getTrackbarPos('R','image')
    g=cv2.getTrackbarPos('G','image')
    b=cv2.getTrackbarPos('B','image')
    s=cv2.getTrackbarPos(switch,'image')

    if s==0:
        img[:]=0
    else:
        img[:]=[b,g,r]

cv2.destroyAllWindows()

结果：