Opencv 一些函数笔记
shape()
有一张图片宽度*高度是300 *100,用opencv的img.shape返回的是(100,300,3),shape返回的是图像的行数,列数,色彩通道数。
易错的地方:
行数其实对应于坐标轴上的y,即表示的是图像的高度
列数对应于坐标轴上的x,即表示的是图像的宽度
也就是说shape返回的是(高度, 宽度) = (y , x)
而
img[50,10]是否表示是(x,y)为(50,10)的那个像素呢,其实不是。
与shape的原理相同,它表示的也是(y,x),即表示第50列第10行的那个元素。
resize()函数
一些详解
- VideoCapture()是用于从视频文件、图片序列、摄像头捕获视频的类 VideoCapture()中参数是0,表示打开笔记本的内置摄像头,参数是视频文件路径则打开视频,如vc = cv2.VideoCapture("…/testi.mp4")
2、ret,frame = vc.read()
vc.read()按帧读取视频,ret,frame是获cap.read()方法的两个返回值。其中ret是布尔值,如果读取帧是正确的则返回True,如果文件读取到结尾,它的返回值就为False。frame就是每一帧的图像,是个三维矩阵。
3、cv2.waitKey(1),waitKey()方法本身表示等待键盘输入,
参数是1,表示延时1ms切换到下一帧图像,对于视频而言;
参数为0,如cv2.waitKey(0)只显示当前帧图像,相当于视频暂停,;
参数过大如cv2.waitKey(1000),会因为延时过久而卡顿感觉到卡顿。
c得到的是键盘输入的ASCII码,esc键对应的ASCII码是27,即当按esc键是if条件句成立
4、调用release()释放摄像头,调用destroyAllWindows()关闭所有图像窗口
import numpy as np
import cv2 as cv
# 创建VideoCapture,传入0即打开系统默认摄像头
vc = cv.VideoCapture(0)
while(True):
# 读取一帧,read()方法是其他两个类方法的结合,具体文档
# ret为bool类型,指示是否成功读取这一帧
ret, frame = vc.read()
# 就是个处理一帧的例子,这里转为灰度图
gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
# 不断显示一帧,就成视频了
# 这里没有提前创建窗口,所以默认创建的窗口不可调整大小
# 可提前使用cv.WINDOW_NORMAL标签创建个窗口
cv.imshow('frame',gray)
# 若没有按下q键,则每1毫秒显示一帧
if cv.waitKey(1) & 0xFF == ord('q'):
break
# 所有操作结束后不要忘记释放
vc.release()
cv.destroyAllWindows()
操作视频文件
import numpy as np
import cv2 as cv
vc = cv.VideoCapture('test.mp4')
while(vc.isOpened()):
ret, frame = cap.read()
gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
cv.imshow('frame',gray)
if cv.waitKey(1) & 0xFF == ord('q'):
break
vc.release()
cv.destroyAllWindows()
cv2.cvtColor(p1,p2) 是颜色空间转换函数,p1是需要转换的图片,p2是转换成何种格式。
cv2.COLOR_BGR2RGB 将BGR格式转换成RGB格式
cv2.COLOR_BGR2GRAY 将BGR格式转换成灰度图片