【计算机视觉】opencv入门学习笔记Part.1

Believer丶

已于 2022-03-11 20:57:19 修改

阅读量339

点赞数

文章标签： opencv 计算机视觉图像处理

于 2021-10-23 19:10:27 首次发布

本文链接：https://blog.csdn.net/qq_44973776/article/details/120922062

版权

【计算机视觉】opencv入门学习笔记Part.1

1 前言

1.1 opencv概述（摘取自百度百科）

opencv全称Open Source Computer Vision Library
opencv是一个基于BSD许可（开源）发行的跨平台计算机视觉和机器学习软件库
可以运行在Linux、Windows、Android和Mac OS操作系统上
它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成
同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。
在可用时利用MMX和SSE指令， 如今也提供对于C#、Ch、Ruby，GO的支持

1.2 图像概念引入

在python当中每个彩色图像相当于一个三维列表
这个三维列表中，有三个二维列表，分别对应R、G、B三个颜色通道
而一维列表中的每一个数值对应一个像素点，数值大小代表亮度，取值为0~255
需要注意的是在opencv读取图片颜色通道顺序为B、G、R

1.3 安装opencv库

按win+r打开控制台输入 pip install opencv-python

2 图像基本操作

（将该图片下载到与项目文件同级的目录下）

2.1 图像的读取

cv2.IMREAD_COLOR：彩色图像
cv2.IMREAD_GRAYSCALE：灰色图像

#导入cv2包
import cv2

#读取名为lena.jpg的图像默认为彩色，赋值给名为的img变量
img = cv2.imread('lena.jpg')
#参数为(263, 263, 3)，分别对应宽、高、颜色通道数量
print("img:", end="")
print(img.shape)

#读取名为lena.jpg的图像选择读取方式为灰度，赋值给名为的imgGray变量
imgGray = cv2.imread('lena.jpg', cv2.IMREAD_GRAYSCALE)
#参数为(263, 263)，分别对应宽、高，灰度图像没有颜色通道数量
print("imgGray:", end="")
print(imgGray.shape)

2.2 图像的显示

import cv2

#读取图像
img = cv2.imread('lena.jpg')
print("img:", end="")
print(img.shape)
imgGray = cv2.imread('lena.jpg', cv2.IMREAD_GRAYSCALE)
print("imgGray:", end="")
print(imgGray.shape)

#图像的显示，第一个参数为窗口名，也可以创建多个窗口
cv2.imshow('imgGray', imgGray)
#等待键盘时间，毫秒级，0表示任意键终止
cv2.waitKey(0)
#销毁所有窗口
cv2.destroyAllWindows()

2.3 图像的保存

import cv2

#以灰度形式读取图像
imgGray = cv2.imread('lena.jpg', cv2.IMREAD_GRAYSCALE)
#将灰度图像保存到本地同级路径名为lenaGray.jpg
cv2.imwrite('lenaGray.jpg', imgGray)

2.4 图像的复制

import cv2

#读取图像
img = cv2.imread('lena.jpg')
#用copy函数复制与原图一模一样的图片（不会保存到本地）
imgCopy = img.copy()
#显示图像
cv2.imshow('imgCopy', imgCopy)
cv2.waitKey(0)
cv2.destroyAllWindow

3 视频的读取

(下载下方视频文件)
https://www.aliyundrive.com/s/MHpVMUA43Zr

cv2.VideoCapture可以捕获摄像头
本地摄像头可用数字来控制不同的设备，如0、1
也可以调用网络摄像头，在参数列表中指定地址即可
还可以读取视频文件，直接指定文件路径

import cv2

#指定路径读取视频文件
vc = cv2.VideoCapture('test.mp4')
#判断视频是否读取成功
while vc.isOpened():
    #读取视频中的每一帧图像，返回的第一个参数为是否读取到，第二个参数为读取到的图像
    ret, frame = vc.read()
    #显示图像
    cv2.imshow('video', frame)
    #通过waitKey函数控制视频播放速度， 0xFF相当与按下ESC键退出
    if cv2.waitKey(20) & 0xFF == 27:
        break

#释放vc资源
vc.release()
#销毁所有窗口
cv2.destroyAllWindows()

4 ROI区域

ROI（region of interest），感兴趣区域。机器视觉、图像处理中
从被处理的图像以方框、圆、椭圆、不规则多边形等方式
勾勒出需要处理的区域，称为感兴趣区域，ROI

4.1 截取图像

import cv2

#读取图像
img = cv2.imread('lena.jpg')
#通过切片的方式截取图像，宽、高各200个像素点
imgPart = img[0:200, 0:200]
#显示图像
cv2.imshow('imgPart', imgPart)
cv2.waitKey(0)
cv2.destroyAllWindow

4.2 提取颜色通道

import cv2

#读取图像
img = cv2.imread('lena.jpg')
#用split函数提取B、G、R三个颜色通道的列表
b, g, r = cv2.split(img)

4.3 合并颜色通道

import cv2

#读取图像
img = cv2.imread('lena.jpg')
#提取B、G、R颜色通道
b, g, r = cv2.split(img)
#用merge函数以B、G、R的顺序合并颜色通道
imgMerge = cv2.merge((b, g, r))
#显示图像
cv2.imshow('imgMerge ', imgMerge )
cv2.waitKey(0)
cv2.destroyAllWindow

4.3 仅保留B/G/R通道

import cv2

#读取图像
img = cv2.imread('lena.jpg')

#仅保留B通道
img_B = img.copy()
img_B[:, :, 1] = 0
img_B[:, :, 2] = 0

#仅保留G通道
img_G = img.copy()
img_G[:, :, 0] = 0
img_G[:, :, 2] = 0

#仅保留R通道
img_R = img.copy()
img_R[:, :, 0] = 0
img_R[:, :, 1] = 0

#通过hconcat将三张图片拼接
imgStack = cv2.hconcat([img_B, img_G, img_R])

#显示图像
cv2.imshow('imgStack', imgStack)
cv2.waitKey(0)
cv2.destroyAllWindow

Believer丶

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【计算机视觉】opencv入门学习笔记Part.1

图像基本操作1 前言1.1 opencv概述（摘取自百度百科）1.2 图像概念引入2 图像基本操作2.1 图像的读取2.2 图像的显示2.3 图像的保存3 视频读取1 前言1.1 opencv概述（摘取自百度百科）opencv全称Open Source Computer Vision Libraryopencv是一个基于BSD许可（开源）发行的跨平台计算机视觉和机器学习软件库可以运行在Linux、Windows、Android和Mac OS操作系统上它轻量级而且高效——由一系列 C 函数和少量
复制链接

扫一扫