本小节将列举出常用的相关的Opencv操作函数,对函数进行列举,不提供详细的使用方法和解释,适用于有一定基础的Opencv使用者进行参考使用
图像读取与保存
cv2.imread() #读入图像
cv2.imshow() 显示图像
cv2.imwrite() 保存一个图像
视频读取与保存
cap=cv2.VideoCapture() #链接摄像头
cap.isOpened() #是否初始化摄像头成功
cap.read() #是否能够读到摄像头的图像
cap.get(propId) 来获得视频的一些参数信息。这里propId 可以是 0 到 18 之间的任何整数。每一个数代表视频的一个属性,我可以使用 cap.get(3) 和 cap.get(4) 来查看每一帧的宽和高。默认情况下得到的值是 640X480。但是我可以使用 ret=cap.set(3,320)和 ret=cap.set(4,240) 来把宽和高改成 320X240。
cv2.VideoWrite() #保存摄像头数据
opencv中的绘图函数
cv2.line(),绘制直线,例如 cv2.line(img,(0,0),(511,511),(255,0,0),5)
cv2.circle(),绘制圆,例如 cv2.circle(img,(447,63), 63, (0,0,255), -1)
cv2.rectangle(),绘制矩形,例如 cv2.rectangle(img,(384,0),(510,128),(0,255,0),3)
cv2.ellipse(),绘制椭圆,例如cv2.ellipse(img,(256,256),(100,50),0,0,180,255,-1)
绘制多边形:
pts=np.array([[10,5],[20,30],[70,20],[50,10]], np.int32)
pts=pts.reshape((-1,1,2))# 这里 reshape 的第一个参数为-1, 表明这一维的长度是根据后面的维度的计算出来的。
cv2.putText(),写文字,例如:
font=cv2.FONT_HERSHEY_SIMPLEX2
cv2.putText(img,'OpenCV',(10,500), font, 4,(255,255,255),2)
Opencv处理鼠标事件
cv2.setMouseCallback()
实例:
import cv2
import numpy as np
#mouse callback function
def draw_circle(event,x,y,flags,param):
if event==cv2.EVENT_LBUTTONDBLCLK:
cv2.circle(img,(x,y),100,(255,0,0),-1)
# 创建图像与窗口并将窗口与回调函数绑定
img=np.zeros((512,512,3),np.uint8)
cv2.namedWindow('image')
cv2.setMouseCallback('image',draw_circle)
while(1):
cv2.imshow('image',img)
if cv2.waitKey(20)&0xFF==27:
break
cv2.destroyAllWindows()
图像操作
像素值操作:
img=cv2.imread('/home/duan/workspace/opencv/images/roi.jpg')
img[100,100]=[255,255,255]
图像的属性包括:行,列,通道,图像数据类型,像素数目等
img=cv2.imread('/home/duan/workspace/opencv/images/roi.jpg')
img.shape ##行数,列数,通道数
img.size ## 总的像素数目
img.dtype ##返回的是图像的数据类型.
图像 ROI,图像特定区域操作
img=cv2.imread('/home/duan/workspace/opencv/images/roi.jpg')
ball=img[280:340,330:390]
img[273:333,100:160]=bal ##实现图像的区域性复制
拆分及合并图像通道
img=cv2.imread('/home/duan/workspace/opencv/images/roi.jpg')
b,g,r=cv2.split(img) #拆分各通道
img=cv2.merge(b,g,r) #合并各通道
或者
img=cv2.imread('/home/duan/workspace/opencv/images/roi.jpg')
b=img[:,:,0] #得到第一通道的数据矩阵
为图像扩边(填充)
cv2.copyMakeBorder()
以下是几种扩充方式:
replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)
图像上的算术运算
加法
cv2.add()
图像混合
cv2.addWeighted()
例如 dst=cv2.addWeighted(img1,0.7,img2,0.3,0) ###0.7和0.3为两个图像的权重,0为叠加后的偏移量
按位运算,按位操作有:AND,OR,NOT,XOR 等
import cv2
import numpy as np
# 加载图像
img1 = cv2.imread('roi.jpg')
img2 = cv2.imread('opencv_logo.png')
# I want to put logo on top-left corner, So I create a ROI
rows,cols,channels = img2.shape
roi = img1[0:rows, 0:cols ]
# Now create a mask of logo and create its inverse mask also
img2gray = cv2.cvtColor(img2,cv2.COLOR_BGR2GRAY)
ret, mask = cv2.threshold(img2gray, 175, 255, cv2.THRESH_BINARY)
mask_inv = cv2.bitwise_not(mask)
# Now black-out the area of logo in ROI
# 取 roi 中与 mask 中不为零的值对应的像素的值,其他值为 0
# 注意这里必须有 mask=mask 或者 mask=mask_inv, 其中的 mask= 不能忽略
img1_bg = cv2.bitwise_and(roi,roi,mask = mask)
# 取 roi 中与 mask_inv 中不为零的值对应的像素的值,其他值为 0。
# Take only region of logo from logo image.
img2_fg = cv2.bitwise_and(img2,img2,mask = mask_inv)
# Put logo in ROI and modify the main image
dst = cv2.add(img1_bg,img2_fg)
img1[0:rows, 0:cols ] = dst
cv2.imshow('res',img1)
cv2.waitKey(0)
cv2.destroyAllWindows()
程序性能检测及优化
cv2.getTickCount 函数返回从参考点到这个函数被执行的时钟数。
cv2.getTickFrequency 返回时钟频率,或者说每秒钟的时钟数。
import cv2
import numpy as np
img1 = cv2.imread('roi.jpg')
e1 = cv2.getTickCount()
for i in xrange(5,49,2):
img1 = cv2.medianBlur(img1,i)
e2 = cv2.getTickCount()
t = (e2 - e1)/cv2.getTickFrequency()
print t