opencv学习笔记——最基础部分


opencv是计算机视觉当中的经典专用库
在使用opencv前,我们需要在python ide中导入Numpy包,Matplotlib包,opencv-contrib-python包和opencv-python包。

入门基础

图像部分

图像读取

import cv2 as cv

filename = "222.png"
# 以RGB模式读取图像
# opencv读取的模式是BGR!!!
img = cv.imread(filename, 1)

# 检查是否成功读取图像
if img is not None:
    cv.imshow("image", img)
    cv.waitKey(0)
    cv.destroyAllWindows()
else:
    print(f"无法读取图像:{filename}")

这是一段简单的图像读取代码,
其中,cv.imread(filename, 1)中filename为文件打开的地址,后面的参数,0加载灰度图像,1加载彩度图像,-1加载图像,并且包括alpha通道。

cv.imshow()为图像显示代码,cv.waitKey()为图像读取的等待时间,单位为毫秒,如果给0,则为无限等待,直到键盘中任意键敲下后图片消失。

cv.destroyAllWindows()是窗口破坏函数,它会破坏所有创建的窗口,如果需要破坏指定窗口可以使用cv.destroyWindow()

import cv2 as cv

# 读取图像
img = cv.imread('image.jpg', 1)

# 创建一个可调整大小的窗口
cv.namedWindow('Normal Window', cv.WINDOW_NORMAL)

# 将图像加载到窗口中
cv.imshow('Normal Window', img)

cv.waitKey(0)
cv.destroyAllWindows()

在特殊情况下,你可以创建一个空窗口,然后再将图像加载到该窗口。在这种情况下,你可以指定窗口是否可调整大小。这是通过功能cv.namedWindow()完成的。默认情况下,该标志为cv.WINDOW_AUTOSIZE。但是,如果将标志指定为cv.WINDOW_NORMAL,则可以调整窗口大小。当图像尺寸过大以及向窗口添加跟踪栏时,这将很有帮助。

图像保存

import cv2 as cv

img = cv.imread("tutu.png", 1)
cv.namedWindow('Normal Window', cv.WINDOW_NORMAL)
cv.imshow("Normal Window", img)

k = cv.waitKey(0)

if k == 27:
    cv.destroyAllWindows()
elif k == ord('s'):
    # 指定一个有效范围内的压缩级别,例如3
    cv.imwrite("HaHa.png", img, [cv.IMWRITE_PNG_COMPRESSION, 3])
     ## 将图像保存为指定大小
    #cv.imwrite("HaHa.jpg", img, [cv.IMWRITE_JPEG_QUALITY, 95])
    cv.destroyAllWindows()

使用函数cv.imwrite(‘output_image.jpg’, img, [cv.IMWRITE_JPEG_QUALITY, 95])保存图像。

第一个参数:文件名,保存的图像格式由文件名的扩展名来确定。例如,如果文件名以’.jpg’结尾,保存的图像将以JPEG格式保存。如果以’.png’结尾,将以PNG格式保存。,如果希望将图像保存到其他目录,可以在文件名中提供完整的路径(如上述代码中注释所写),第二个参数是要保存的图像。

第二个参数:图片

第三个参数:图片如果是jpg格式表示质量,越高质量越好,文件也越大,范围是0~100.
PNG 格式指压缩级别。范围是0到9,0表示无压缩,9表示最高压缩。请注意,对于 PNG 格式,这并不影响图像的质量,而是影响文件大小。
k=‘27’ 对应于键盘上的 “ESC” 键的 ASCII 值
注意:

1.opencv加载的彩色图片为BGR模式,而matplotlip以RGB模式显示。(matplotlip是python的绘图库)
2.打开文件的路径名称必须全为英文,否则会报错

视频部分

###从相机中读取视频

import cv2 as cv
# cap = cv2.VideoCapture(0, cv2.CAP_DSHOW),此为该代码全称,默认彩色输出 
# 一般0表示内置摄像头,1表示第一个外接摄像头,依此类推
cap=cv.VideoCapture(0)  
if not cap.isOpened():
    print("can't open camera")
    exit()
while True:
    ret,frame=cap.read()  ret:返回的值为布尔数True或者None,frame:返回的为一帧图像
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    #src:输入的图像    cv.cvtColor(src, code[, dst[, dstCn]])此为代码全称
    #code:颜色转换代码,此处将彩色图像转换为灰度图像
    gray=cv.cvtColor(frame,cv.COLOR_BGR2GRAY)   
    cv.imshow("frame",gray)
    if cv.waitKey(0)==ord("q"):
        break
    cap.release()  释放摄像头
    cv.destroyAllWindows()

cv2.COLOR_BGR2GRAY:将 BGR 彩色图像转换为灰度图像。
cv2.COLOR_BGR2RGB:将 BGR 彩色图像转换为 RGB 彩色图像。
cv2.COLOR_BGR2HSV:将 BGR 彩色图像转换为 HSV 颜色空间。
cv2.COLOR_BGR2LAB:将 BGR 彩色图像转换为 CIE Lab* 颜色空间。
cv2.COLOR_BGR2XYZ:将 BGR 彩色图像转换为 CIE 1931 XYZ 颜色空间。
等等…

cap.set(cv2.CAP_PROP_FRAME_WIDTH, 1280)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 720)
如果你的摄像头支持更高分辨率或其他特定的设置,你可以通过调用 cap.set() 方法设置摄像头参数,
该代码将摄像头的参数设置为 1280 x 720 像素。默认情况下分辨率为640 x 480

###从文件中读取视频

import cv2 as cv

cap = cv.VideoCapture("menglvren.mp4")
if not cap.isOpened():
    print("Can't open camera")
    exit()
while True:
    ret, frame = cap.read()
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    cv.namedWindow('frame', cv.WINDOW_NORMAL)
    cv.imshow("frame", frame)
    if cv.waitKey(1) == ord("q"):
        break
cap.release()
cv.destroyAllWindows()

从文件中读取视频与从相机中读取视频几乎一样,不同之处在于将摄像机索引更改为视频文件地址,在显示框架时,请使用适当的时间cv.waitKey()。如果太小,则视频将非常快,而如果太大,则视频将变得很慢(这就是显示慢动作的方式)。正常情况下25毫秒就可以了。

视频保存

import cv2 as cv
cap = cv.VideoCapture(0)
if not cap.isOpened():
    print("Can't open camera")
    exit()
# 定义XVID编码器并创建VideoWriter对象
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('output.avi', fourcc, 20.0, (640, 480))
while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    # 对视频进行水平镜像翻转,如有需要,直接将下行代码取消注释即可
    #frame=cv.flip(frame,0)
    # 写入帧到输出视频文件
    out.write(frame)
    # 在窗口中显示帧
    cv.imshow('frame', frame)
    # 如果用户按下 'q' 键,退出循环
    if cv.waitKey(1) == ord('q'):
        break
# 释放摄像头资源和视频写入对象
cap.release()
out.release()
# 关闭OpenCV窗口
cv.destroyAllWindows()

cv.VideoWriter_fourcc(*‘XVID’):
定义视频编解码器的四字符代码(FourCC)为XVID,指定视频文件的编码方式。

cv.VideoWriter(‘output.avi’, fourcc, 20.0, (640, 480)):
创建一个 VideoWriter 对象 (out),用于写入视频文件。
‘output.avi’ 是输出视频文件的文件名。
fourcc 是编解码器的四字符代码。
20.0 是帧率,表示每秒写入的帧数。
(640, 480) 是视频的分辨率。

cv.flip(frame, 0): 水平镜像翻转函数

注:除XVID外,还有H.264(AVC)这样的编解码

绘图

画直线
cv2.line(image, start_point, end_point, color, thickness)

画矩形
cv2.rectangle(image, top_left, bottom_right, color, thickness)

画圆
cv2.circle(image, center, radius, color, thickness)

画椭圆
cv2.ellipse(image, center, axes, angle, start_angle, end_angle, color, thickness)

写文本
cv2.putText(image, text, org, font_face, font_scale, color, thickness)

画多边形
cv2.polylines(image, [pts], is_closed, color, thickness)

填充多边形
cv2.fillPoly(image, [pts], color)

#画一条蓝色直线
import cv2
import numpy as np

image = np.zeros((300, 400, 3), dtype=np.uint8)  # 创建一个黑色图像
start_point = (50, 50)
end_point = (350, 250)
#因为opencv是BGR而不是RGB,所以(255,0,0)是蓝色
color = (255, 0, 0)  # 蓝色
thickness = 2

cv2.line(image, start_point, end_point, color, thickness)

cv2.imshow('Line Example', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

画蓝色直线
在NumPy中,dtype(数据类型)参数用于指定数组的数据类型。np.uint8 表示无符号8位整数,即取值范围为 0 到 255 的整数。在图像处理中,常常使用 np.uint8 数据类型表示像素值,因为它适用于 8位图像,每个通道的像素值可以在 0 到 255 之间取值。

#写红色文本
import cv2
import numpy as np

image = np.zeros((300, 400, 3), dtype=np.uint8)  # 创建一个黑色图像
text = 'Hello, OpenCV!'
org = (50, 150)  #文本的起始坐标,即文本左下角的坐标
font_face = cv2.FONT_HERSHEY_SIMPLEX  #字体类型
font_scale = 1  #字体缩放因子
color = (0, 0, 255)  # 红色
thickness = 2

cv2.putText(image, text, org, font_face, font_scale, color, thickness)

cv2.imshow('Text Example', image)
cv2.waitKey(0)
cv2.destroyAllWindows()
import cv2
import numpy as np

# 创建一个黑色图像
image = np.zeros((300, 400, 3), dtype=np.uint8)

# 定义中文字体属性
text = '你好,OpenCV!'
org = (50, 150)
fontFace = cv2.FONT_HERSHEY_SIMPLEX
fontScale = 1
color = (0, 0, 255)  # 红色
thickness = 2

# 加载中文字体文件(替换为你下载的中文字体文件路径)
font = cv2.FONT_HERSHEY_SIMPLEX
fontpath = "path/to/chinese/font.ttf"

# 创建一个cv2的字体对象
cv2_font = cv2.freetype.createFreeType2()
cv2_font.loadFontData(fontpath)

# 在图像上写入中文文本
cv2_font.putText(image, text, org, fontScale, color, thickness)

# 显示图像
cv2.imshow('Chinese Text Example', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

opencv显示中文需要中文字体文件,字体文件本身通常不是第三方库,而是一种字体文件格式,例如 TrueType Font(TTF)或 OpenType Font(OTF)。字体文件包含了字符的字形信息,使得计算机能够正确渲染和显示文本。
确保替换 fontpath 变量为你下载的中文字体文件的路径。
写红色文本

鼠标作为画笔

import cv2 as cv
import numpy as np

drawing = False  # 是否绘制矩形的标志
rect_start = (-1, -1)  # 矩形的起始坐标

def onMouse(event, x, y, flags, param):
    global drawing, rect_start

    if event == cv.EVENT_LBUTTONDOWN:   #鼠标左击事件
        drawing = True
        rect_start = (x, y)

    elif event == cv.EVENT_LBUTTONUP:  #鼠标左击取消事件
        drawing = False
        rect_end = (x, y)
        cv.rectangle(img, rect_start, rect_end, (0, 255, 0), 2)
        cv.imshow('image', img)

    elif event == cv.EVENT_MOUSEMOVE and drawing:    #鼠标移动事件
        # 在鼠标移动时,绘制即时矩形
        img_temp = img.copy()
        rect_end = (x, y)
        cv.rectangle(img_temp, rect_start, rect_end, (0, 255, 0), 2)
        cv.imshow('image', img_temp)

    elif event == cv.EVENT_RBUTTONDOWN:   #鼠标右击事件,这里单纯是为了看看flags和param的功能而写的
        # 使用 flags 和 param 进行额外的交互
        print(f'Right mouse button clicked at ({x}, {y})')
        print(f'Flags: {flags}')
        print(f'Param: {param}')

img = np.zeros((512, 512, 3), np.uint8)
cv.imshow('image', img)

# 在 setMouseCallback 中传递额外的参数
cv.setMouseCallback('image', onMouse, param='Hello, OpenCV!')

while True:
    key = cv.waitKey(1) & 0xFF
    if key == 27:  # 按Esc键退出
        break

cv2.destroyAllWindows()

这里用到了鼠标作为画笔来进行图形绘制,此代码可以通过鼠标来进行矩形的绘制
cv2.setMouseCallback(windowName, onMouse, param=None)
windowName: 图像窗口的名称,指定回调函数关联的窗口。
onMouse: 回调函数,它将在鼠标事件发生时被调用。
param: 可选参数,传递给回调函数的额外参数。(目前根据我的判断来说,这个部分是不需要我们填写的,保持原样即可)
onMouse(event, x, y, flags, param):
event 参数表示触发的鼠标事件,x 和 y 表示鼠标在图像上的坐标,flags 包含有关鼠标的额外信息,param 是传递给回调函数的额外参数。

轨迹栏作为调色板

import numpy as np
import cv2 as cv

def nothing(x):
    pass

# 创建一个黑色的图像,一个窗口
img = np.zeros((512, 512, 3), np.uint8)
cv.namedWindow('image')

# 创建颜色变化的轨迹栏
cv.createTrackbar('R', 'image', 0, 255, nothing)
cv.createTrackbar('G', 'image', 0, 255, nothing)
cv.createTrackbar('B', 'image', 0, 255, nothing)

# 为 ON/OFF 功能创建开关
switch = '0 : OFF \n1 : ON'
cv.createTrackbar(switch, 'image', 0, 1, nothing)

while True:
    cv.imshow('image', img)
    k = cv.waitKey(1) & 0xFF

    if k == 27:  # 按下Esc键退出循环
        break

    # 得到四条轨迹的当前位置
    r = cv.getTrackbarPos('R', 'image')
    g = cv.getTrackbarPos('G', 'image')
    b = cv.getTrackbarPos('B', 'image')
    s = cv.getTrackbarPos(switch, 'image')

    if s == 0:
        img[:] = 0  # 如果开关为0,将图像设置为全黑
    else:
        img[:] = [b, g, r]  # 如果开关为1,根据滑动条的值设置图像的颜色

cv.destroyAllWindows()

这是轨迹栏作为调色板的简单应用

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值