OpenCV中cv2的常见用法

一、读入图像

  • 使用函数cv2.imread(filepath,flags)读入一副图片

  • filepath:要读入图片的完整路径

  • flags:读入图片的标志

  • cv2.IMREAD_COLOR:默认参数,读入一副彩色图片,忽略alpha通道

  • cv2.IMREAD_GRAYSCALE:读入灰度图片

  • cv2.IMREAD_UNCHANGED:顾名思义,读入完整图片,包括alpha通道

import cv2
img = cv2.imread('1.jpg',cv2.IMREAD_GRAYSCALE)

二、显示图像

  • 使用函数cv2.imshow(wname,img)显示图像,第一个参数是显示图像的窗口的名字,第二个参数是要显示的图像(imread读入的图像),窗口大小自动调整为图片大小

cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
#dv2.destroyWindow(wname)
  • cv2.waitKey顾名思义等待键盘输入,单位为毫秒,即等待指定的毫秒数看是否有键盘输入,若在等待时间内按下任意键则返回按键的ASCII码,程序继续运行。若没有按下任何键,超时后返回-1。参数为0表示无限等待。不调用waitKey的话,窗口会一闪而逝,看不到显示的图片。

  • cv2.destroyAllWindow()销毁所有窗口

  • cv2.destroyWindow(wname)销毁指定窗口

三、保存图像

  • 使用函数cv2.imwrite(file,img,num)保存一个图像。第一个参数是要保存的文件名,第二个参数是要保存的图像。可选的第三个参数,它针对特定的格式:对于JPEG,其表示的是图像的质量,用0 - 100的整数表示,默认95;对于png ,第三个参数表示的是压缩级别,默认为3

  • cv2.IMWRITE_JPEG_QUALITY类型为 long ,必须转换成 int

  • cv2.IMWRITE_PNG_COMPRESSION, 从0到9 压缩级别越高图像越小。

cv2.imwrite('1.png',img, [int( cv2.IMWRITE_JPEG_QUALITY), 95])
cv2.imwrite('1.png',img, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

四、图片操作

1、使用函数cv2.flip(img,flipcode)翻转图像,flipcode控制翻转效果。

  • flipcode = 0:沿x轴翻转

  • flipcode > 0:沿y轴翻转

  • flipcode < 0:x,y轴同时翻转

imgflip = cv2.flip(img,1)

2、复制图像

imgcopy = img.copy()

3、颜色空间转换

#彩色图像转为灰度图像
img2 = cv2.cvtColor(img,cv2.COLOR_RGB2GRAY) 
#灰度图像转为彩色图像
img3 = cv2.cvtColor(img,cv2.COLOR_GRAY2RGB)
# cv2.COLOR_X2Y,其中X,Y = RGB, BGR, GRAY, HSV, YCrCb, XYZ, Lab, Luv, HLS
  • 示例

import cv2
# img=cv2.imread('1.jpg',cv2.IMREAD_COLOR)
img=cv2.imread('1.png',cv2.IMREAD_COLOR)    # 打开文件
font = cv2.FONT_HERSHEY_DUPLEX  # 设置字体
# 图片对象、文本、像素、字体、字体大小、颜色、字体粗细
imgzi = cv2.putText(img, "zhengwen", (1100, 1164), font, 5.5, (0, 0, 0), 2,)
# cv2.imshow('lena',img)

cv2.imwrite('5.png',img)    # 写磁盘
cv2.destroyAllWindows()     # 毁掉所有窗口
cv2.destroyWindow(wname)    # 销毁指定窗口

五、opencv拍摄视频并保存

import cv2

cam = cv2.VideoCapture(0)
wid = int(cam.get(3))
hei = int(cam.get(4)) 
size = (wid,hei)
fps = 30
 
fourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')
out = cv2.VideoWriter()
out.open(r"/home/ucar/ucar_ws/src/video/11.mp4",fourcc, fps, size)
 
while True:
    ret, frame  = cam.read()
    if not ret:
        break
    frame = cv2.flip(frame,1)
    
    out.write(frame)
    cv2.imshow("frame",frame)
    
    key = cv2.waitKey(100)
    if cv2.waitKey(25) & 0xFF == ord('1'):  # 当按键 1 按下
            break
cam.release()
out.release()
cv2.destroyAllWindows()

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SIFT概述p200 在前面我们学习了角点检测技术,比如Harris等。它们具有旋转不变特性,即使图片发生了旋转,我们也能找到同样的角点,很明显即使图像发生旋转之后角点还是角点。但是如果我们对图像进行缩放,那么角点就可能不再是角点了。所以基于这个问题,尺度不变特征变换(SIFT)出现了,这个算法可以帮助我们提取图像的关键点并计算它们的描述符。 • 尺度空间极值检测 • 关键点精准定位与过滤 • 关键点方向指派 • 描述子生成 1. 尺度空间极值检测: (由Harris的弊端)我们知道在不同的尺度空间不能使用相同的窗口检测极值点。对于小的角点要用小的窗口。对于大的角点只能使用大的窗口。为了达到这个目的我们需要使用尺度空间滤波器(由一些列具有不同方差sigma的高斯卷积核构成)。 使用具有不同方差值sigma的高斯拉普拉斯算子(LoG)对图像进行卷积,LoG由于具有不同的方差值sigma所以可以用来检测不同大小的斑点,简单来说方差sigma就是一个尺度变换因子,使用一个小方差sigma的高斯卷积核可以很好地检测出小的角点,而是用大方差sigma的高斯卷积核可以很好打的检测出大的角点。 我们可以在尺度空间和二维平面检测到局部最大值,如(x,y,sigma),这表示sigma尺度(x,y)点可能是一个关键点。但是这个LoG的计算量非常大,所以SIFT算法使用高斯差分算子(DoG)来对LoG做近似。 DoG是下图这组具有不同分辨率的图像金字塔相邻的两层之间的差值。 在DoG搞定之后,就可以在不同的尺度空间和2D平面搜索局部最大值了。对于图像的一个像素点而言,它需要与自己周围的8个点和上下层18个点相比,如果是局部最大值,它就可能是一个关键点。基本上关键点就是图像在相应尺度空间的最好代表。如下图所示: 该算法默认尺度空间为5,经过DoG算法得到4层。所以该算法的作者在文章给出了SIFT参数的经验值:octave =4。 2. 关键点(极值点)定位---删边界点,去掉低灰度值点 kp 我们通过contrastThreshold阈值来将关键点修正以得到更正确的结果。作者使用尺度空间的泰勒级数展开来获得极值的准确位置,若极值点的灰度值小于阈值(0.03)就会被忽略掉。 DoG算法对边界非常敏感,所以我们必须要把边界去除。我们知道Harris算法除了可以用于角点检测之外还可以用于检测边界。作者就是使用了同样的思路。作者用了Hessian矩阵计算主曲率。从Harris角点检测的算法,我们知道当一个特征值远远大于另一个特征值检测到的是边界。所以他们使用了一个简单的函数,如果比例高于阈值(opencv称为边界阈值),这个关键点就会被忽略。文章给出的边界阈值为10.。 3. 为关键点(极值点)指定方向参数 ,描述符生成: des1 现在我们要为每一个关键点赋予一个反向参数,这样它才会具有旋转不变性。 获取关键点(所在尺度空间)的邻域,然后计算这个区域的梯度级和方向,根据计算得到的结果来创建一个方向直方图,其直方图的峰值为主方向参数,如果其它的任何柱子的高度高于峰值的80%,则被认为是辅方向。 新的关键点描述被创建了。选取与关键点周围一个16*16的邻域,把它分成16个4*4的小方块,为每个小方块创建一个具有8个bin的方向直方图。总共加起来有128个bin,由此组成了128的向量就构成了关键点的描述符。 而代码sift = cv.xfeatures2d.create_SIFT() kp,des=sift.detectAndCompute(gray,None)这两句话的原理就是1-3 4. 关键点匹配 采用关键点特征向量的欧式距离作为两幅图像关键点的相似性判定度量。取第一个图的某个关键点,通过遍历找到第二幅图像的距离最近的那个关键点。cv.BFMatcher,match()就是这个原理,1对1特征点,即返回最佳匹配。 而在有些情况下,第二个距离最近的关键点与第一个距离最近的关键点靠的太近,这可能是由于噪声等引起的,此时要计算最近距离与第二近距离的比值,如果比值大于0.8,就会忽略掉。而cv.BFMatcher.knnMatch就是基于这个原理 cv.BFMatcher.knnMatch可以指定每个关键点返回k个最佳匹配,这里不妨令k=2。 源码: img1 = cv.imread("E:/opencv/picture/test1.jpg") img2 = cv.imread("E:/opencv/picture/test2.jpg") gray1 = cv.cvtCo

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值