图像基本操作
环境配置地址
- Anaconda:Anaconda:https://www.anaconda.com/download/
- Python_whl:https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv
- 资料链接:复制这段内容后打开百度网盘App,操作更方便哦。 链接:https://pan.baidu.com/s/1nBs0RGffKamNNA4OlBIKdQ 提取码:3qp8
图像有很多像素点组成,RGB三通道,每个相当于一个矩阵,根据图像的像素来决定矩阵大小。
数据读取-图像 - cv2.IMREAD_COLOR:彩色图像
- cv2.IMREAD_GRAYSCALE:灰度图像
import cv2 #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline #魔法指令,是jupyter notebook中特有的,为了方便图形的展示
img=cv2.imread('cat.jpg')
结果展示,RGB像素点值在[0,255]之间
array(
可以看出是三维度
[[[142, 151, 160],
[146, 155, 164],
[151, 160, 169],
...,
[156, 172, 185],
[155, 171, 184],
[154, 170, 183]],
[[107, 118, 126],
[112, 123, 131],
[117, 128, 136],
...,
[155, 171, 184],
[154, 170, 183],
[153, 169, 182]],
[[108, 119, 127],
[112, 123, 131],
[118, 129, 137],
...,
[154, 170, 183],
[153, 169, 182],
[152, 168, 181]],
...,
[[162, 186, 198],
[157, 181, 193],
[142, 166, 178],
...,
[181, 204, 206],
[170, 193, 195],
[149, 172, 174]],
[[140, 164, 176],
[147, 171, 183],
[139, 163, 175],
...,
[167, 187, 188],
[123, 143, 144],
[104, 124, 125]],
[[154, 178, 190],
[154, 178, 190],
[121, 145, 157],
...,
[185, 198, 200],
[130, 143, 145],
[129, 142, 144]]], dtype=uint8)
#图像的显示,也可以创建多个窗口
cv2.imshow('image',img)
# 等待时间,毫秒级,0表示任意键终止
cv2.waitKey(0)
cv2.destroyAllWindows()
显示效果
为了方便,定义一个函数,用来显示图像
def cv_show(name,img):
cv2.imshow(name,img)
cv2.waitKey(0)
cv2.destroyAllWindows()
img.shape
结果(414, 500, 3),在cv中以BGR显示,h,w,c
img=cv2.imread("cat.jpg",cv2.IMREAD_GRAYSCALE)
img
array([[153, 157, 162, …, 174, 173, 172],
[119, 124, 129, …, 173, 172, 171],
[120, 124, 130, …, 172, 171, 170],
…,
[187, 182, 167, …, 202, 191, 170],
[165, 172, 164, …, 185, 141, 122],
[179, 179, 146, …, 197, 142, 141]], dtype=uint8)
img.shape
(414, 500)
得到一个颜色通道
cv_show("a",img)
#保存
cv2.imwrite("myCat.jpg",img)
#像素点个数
img.size
207000
#数据类型
img.dtype
dtype('uint8')
数据读取-视频
- cv2.VideoCapture可以捕获摄像头,用数字来控制不同的设备,例如0,1。
- 如果是视频文件,直接指定好路径即可。
视频是由一帧一帧组成的
vc=cv2.VideoCapture("test.mp4")
# 检查是否打开正确
if vc.isOpened():
#read()读取视频的每一帧,第一个参数为布尔型,能读取为true,第二个参数为一帧的图像
oepn, frame = vc.read()
else:
open = False
while oepn:
ret, frame = vc.read()
if frame is None:
break
#读取成功
if ret == True:
#转换成灰度图
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
#展示
cv2.imshow('result', gray)
#27在键盘上表示退出键esc
if cv2.waitKey(100) & 0xFF == 27:
break
vc.release()
cv2.destroyAllWindows()
截取部分图像数据
img=cv2.imread('cat.jpg')
cat=img[0:50,0:200]
cv_show('cat',cat)
颜色通道提取
b,g,r=cv2.split(img)
r
array([[160, 164, 169, …, 185, 184, 183],
[126, 131, 136, …, 184, 183, 182],
[127, 131, 137, …, 183, 182, 181],
…,
[198, 193, 178, …, 206, 195, 174],
[176, 183, 175, …, 188, 144, 125],
[190, 190, 157, …, 200, 145, 144]], dtype=uint8)
r.shape
(414, 500)
# 只保留R
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show('R',cur_img)
# 只保留G
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show('G',cur_img)
# 只保留B
cur_img = img.copy()
cur_img[:,:,1] = 0
cur_img[:,:,2] = 0
cv_show('B',cur_img)
边界填充
- BORDER_REPLICATE:复制法,也就是复制最边缘像素。
- BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb
- BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
- BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg
- BORDER_CONSTANT:常量法,常数值填充。
top_size,bottom_size,left_size,right_size = (50,50,50,50)
replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)
import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')
plt.show()
数值计算
img_cat=cv2.imread('cat.jpg')
img_dog=cv2.imread('dog.jpg')
#把img_cat这张图像素点(500x500x3)的每一个像素加上10
img_cat2= img_cat +10
#打印前五行
img_cat[:5,:,0]
array([[142, 146, 151, ..., 156, 155, 154],
[108, 112, 118, ..., 155, 154, 153],
[108, 110, 118, ..., 156, 155, 154],
[139, 141, 148, ..., 156, 155, 154],
[153, 156, 163, ..., 160, 159, 158]], dtype=uint8)
img_cat2[:5,:,0]
array([[152, 156, 161, ..., 166, 165, 164],
[117, 122, 127, ..., 165, 164, 163],
[118, 122, 128, ..., 164, 163, 162],
[149, 153, 158, ..., 166, 165, 164],
[163, 168, 173, ..., 170, 169, 168]], dtype=uint8)
#相加超过256就会% 256,取余数
#相加的前提条件是:必须维度一样
(img_cat + img_cat2)[:5,:,0]
array([[ 38, 46, 56, ..., 66, 64, 62],
[224, 234, 244, ..., 64, 62, 60],
[226, 234, 246, ..., 62, 60, 58],
[ 32, 40, 50, ..., 66, 64, 62],
[ 60, 70, 80, ..., 74, 72, 70]], dtype=uint8)
#只要相加之后大于255,就取值255
cv2.add(img_cat,img_cat2)[:5,:,0]
array([[255, 255, 255, ..., 255, 255, 255],
[224, 234, 244, ..., 255, 255, 255],
[226, 234, 246, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
图像融合
#读取的两张图片
img_cat + img_dog
只要像素点完全一样才可以融合
img_dog = cv2.resize(img_dog, (500, 414))
img_dog.shape
res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)
plt.imshow(res)
res = cv2.resize(img, (0, 0), fx=4, fy=4)
plt.imshow(res)
res = cv2.resize(img, (0, 0), fx=1, fy=3)
plt.imshow(res)