目录
一、唠嗑
楼主只是想记录一下学习的内容,对于不理解的概念、内容都会录入到文章中进行解读。文章的内容可能是书本一整个章节所有不理解的内容,也可能是某一个章节某一小节的内容。目的就是为了加深理解,以实践为主。
二、灰度 / BGR 颜色通道
(1) 灰度
1-1. 数据格式及含义
灰度图片数据格式是一个二维数组,数组的每个元素都是一个byte字节,范围在[0, 255],0代表黑色/255代表白色。二维数组的宽就是图片的宽,长就是图片对应的长。
1-2. 生成灰度图
了解到灰度图片是一个二维数组,集合中元素的类型是byte之后,我们可以随机生成这种数据。
import os
import numpy
import cv2
random = os.urandom(120000)
array = numpy.array(bytearray(random))
img = array.reshape(300, 400)
filename = 'G:\\img.png'
cv2.imwired(filename, img)
- os.urandom()
会生成指定数量的随机数,这些随机数的范围在[0, 255],生成的数据格式是b''
这是一串二进制字符串。比如:os.urandom(2)
生成两个byteb'\x01\x02'
,转成数组就是[1, 2]。这个b''
要转换成bytearray(b'')
才能转换成列表[]
- bytearray
把b''
转换成bytearray(b'')
的一个函数 - numpy.array
可以把bytearray(b'')
转换成列表[]
的一个函数 - reshape
这个函数可以改变列表的维度。这里的应用就是把一维的数组改成300 * 400 的一个新的数组。
1-3. 作用及其意义
(2) BGR (蓝-绿-红)
1-1. 数据格式及含义
BGR的数据格式是一个三维的数组
,一二维代表图像的宽高,第三维就是颜色通道,颜色通道的顺序就是 蓝 - 绿 - 红,每一个通道的值范围都在[0, 255]。
1-2. 生成BGR图片
import os
import numpy
import cv2
random = os.urandom(120000)
array = numpy.array(bytearray(random))
# 把一维数组转成三维,得出的图片宽高为100 * 400,3对应的就是BGR三种颜色通道
img = array.reshape(100, 400, 3)
filename = 'G:\\img.png'
cv2.imwired(filename, img)
1-3. 截取图片
cutOut = cv2.imread('G:\\image\\357e1cc53bcda14e7889d92f22c10f07.jpeg')
region = cutOut[0:1000, 0:1000]
cutOut[1000:2000, 1000:2000] = region
cv2.imwrite('G:\\image\\cutOut.png', cutOut)
原图:
效果图:
三、捕抓摄像头 / 面向对象封装
(1) 简单的dome
重点就是获取帧,输出帧。
import cv2
# 获取摄像头流
videoCapture = cv2.VideoCapture(0)
# 帧
fps = 30
# 宽高
size = (int(videoCapture.get(cv2.CAP_PROP_FRAME_WIDTH)),
int(videoCapture.get(cv2.CAP_PROP_FRAME_HEIGHT)))
# 输出
videoWriter = cv2.VideoWriter('G:\\MyOutputVid.avi',
cv2.VideoWriter_fourcc('I', '4', '2', '0'),
fps,
size)
# get 300帧的视频
numFrameRemaining = 10 * fps
success = True
while success and numFrameRemaining > 0:
success, frame = videoCapture.read()
videoWriter.write(frame)
numFrameRemaining -= 1