唐宇迪博士opencv课程学习笔记

数据读取-图像
- cv2.IMREAD_COLOR:彩色图像
- cv2.IMREAD_GRAYSCALE:灰度图像
# opencv读取的格式是BGR
import cv2
impoet matplotlib.pyplot as plt
import numpy as np
%matplotlib inline # 魔法函数
img = cv2.imread('cat.jpg')
img
array([[[142, 151, 160],
[146, 155, 164],
[151, 160, 169],
...,
[156, 172, 185],
[155, 171, 184],
[154, 170, 183]],
[[107, 118, 126],
[112, 123, 131],
[117, 128, 136],
...,
[155, 171, 184],
[154, 170, 183],
[153, 169, 182]],
[[108, 119, 127],
[112, 123, 131],
[118, 129, 137],
...,
[154, 170, 183],
[153, 169, 182],
[152, 168, 181]],
...,
...
[121, 145, 157],
...,
[185, 198, 200],
[130, 143, 145],
[129, 142, 144]]], dtype=uint8)
# 图像显示,也可以创建多个窗口
cv2.inshow('image', img)
# 等待时间,毫秒级,0表示任意键终止
cv2.waitKey(0)
cv2.destoryAllWindows()
def cv_show(name, img)
cv2.imshow(name, img)
cv2.waitkey(0)
cv2.destoryAllWindows()
img.shape
(414, 500, 3)
# h w c (RGB)
img=cv2.imread('cat.jpg', cv2.IMREAD_GRAYSCALE)
img
array([[153, 157, 162, ..., 174, 173, 172],
[119, 124, 129, ..., 173, 172, 171],
[120, 124, 130, ..., 172, 171, 170],
...,
[187, 182, 167, ..., 202, 191, 170],
[165, 172, 164, ..., 185, 141, 122],
[179, 179, 146, ..., 197, 142, 141]], dtype=uint8)
img.shape
(414, 500)
# 保存
cv2.imwrite('mycat.png', img)
# 照片格式
type(img)
numpy.ndarray
# 像素点个数
img.size
20700
# 数据类型
img.dtype
dtype('uint8')
数据读取-视频
- cv2.VideoCapture可以捕获摄像头,用数字来控制不同的设备,例如0, 1。
- 如果是视频文件,直接制定好路径即可。
vc = cv2.VideoCapture('test.mp4')
# 检查是否正确
if vc.isOpened():
open, frame = vc.read()
else:
open = False
while open:
ret, frame = vc.read()
if frame is None: # 图像不为空
break
if ret == True:
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 转换成黑白图
cv2.imshow('result', gray)
if cv2.waitKey(10) & 0xFF == 27: # waitKey(1)计算机性能有多快,处理就有多块
break
vc.release()
cv2.destroyAllWindows()
截取部分图像数据
img = cv2.imread('cat.jpg')
cat=img[0:200, 0:200] # h w
cv_show('cat', cat) # 前面自己定义的函数
颜色通道提取
b, g, r = cv2.split(img)
# 虽然像素点大小不一样,但shape大小一定是相同的,要不然就不是一张图像中切出来的
b.shape
(414, 500)
# 颜色组合
img = cv2.merge((b, g, r))
img.shape
(414, 500, 3)
# 只保留R
cur_img = img.copy()
cur_img[:, :, 0] = 0
cur_img[:, :, 1] = 0
cv_show('R', cur_img)
边界填充
# 上下左右分别填充的大小
top_size, bottom_size, left_size, right_size = (50,50,50,50)
# borderType按照什么方式进行填充
replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)
import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')
plt.show()
- BORDER_REPLICATE:复制法,也就是复制最边缘像素。
- BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb
- BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
- BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg
- BORDER_CONSTANT:常量法,常数值填充
不需要记type值,记住方法和输出样子就行
数值计算
img_cat = cv2.imread('cat.jpg')
img_dog = cv2.imread('dog.jpg')
img_cat2 = img_cat + 10 # 相当于在每个像素点上都加上10
img_cat[:5, :, 0]
array([[142, 146, 151, ..., 156, 155, 154],
[107, 112, 117, ..., 155, 154, 153],
[108, 112, 118, ..., 154, 153, 152],
[139, 143, 148, ..., 156, 155, 154],
[153, 158, 163, ..., 160, 159, 158]], dtype=uint8)
img_cat2[:5, :, 0]
# [:5, :, 0] 为了不打印太多,选择前5行和一个通道。
array([[152, 156, 161, ..., 166, 165, 164],
[117, 122, 127, ..., 165, 164, 163],
[118, 122, 128, ..., 164, 163, 162],
[149, 153, 158, ..., 166, 165, 164],
[163, 168, 173, ..., 170, 169, 168]], dtype=uint8)
# 相当于% 256
(img_cat + img_cat2)[:5, :, 0]
array([[ 38, 46, 56, ..., 66, 64, 62],
[224, 234, 244, ..., 64, 62, 60],
[226, 234, 246, ..., 62, 60, 58],
[ 32, 40, 50, ..., 66, 64, 62],
[ 60, 70, 80, ..., 74, 72, 70]], dtype=uint8)
# a>255 ? 255:a
cv2.add(img_cat, img_cat2)[:5, :, 0]
array([[255, 255, 255, ..., 255, 255, 255],
[224, 234, 244, ..., 255, 255, 255],
[226, 234, 246, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
图像融合
前提是两张图片的 shape 值需要一样
img_dog = cv2.resize(img_dog, (500, 414))
res = cv2.resize(img, (0, 0), fx=1, fx=3) # 倍数
res = cv2.resize(img, (0, 0), fx=4, fx=4) # 同比例放缩
res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0) # 最后一个系数是亮度
图像重构
主要参数
dst = cv2.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]])
参数意义:
- scr:原图像
- dsize:输出的图像大小
- dst:输出的图像。当参数dsize不为0时,dst的大小为size;否则,它的大4. 小需要根据src的大小,fx和fy决定。
- fx:沿水平轴的比例因子
- fy:沿垂直轴的比例因子
参数dsize和参数(fx, fy)不能够同时为0
interpolation:插值方法,共5种:
- INTER_LINEAR - 双线性插值(默认)(放大图像推荐使用)
- INTER_NEAREST - 最近邻插值
- INTER_AREA - 基于像素局部的重采样插值(缩小图像推荐使用)。该方法对于图像抽取(image decimation)来说可能更好,但如果是放大图像,和最近邻插值效果类似。
- INTER_CUBIC - 基于4x4像素邻域的3次插值(放大图像推荐使用)
- INTER_LANCZOS4 - 基于8x8像素邻域的Lanczos(兰索斯)插值