跟着大白小浪一起学——人工智能-计算机视觉（一）

最新推荐文章于 2023-01-16 20:04:33 发布

YuZou 邹宇

最新推荐文章于 2023-01-16 20:04:33 发布

阅读量3.8k

点赞数 2

分类专栏：笔记 python 文章标签：计算机视觉人工智能 opencv python

本文链接：https://blog.csdn.net/qq_45430571/article/details/121243999

版权

笔记同时被 2 个专栏收录

78 篇文章 6 订阅

订阅专栏

python

19 篇文章 1 订阅

订阅专栏

跟着大白小浪一起学——人工智能-计算机视觉（一）

学习网站

学习网站

B站学习网址：人工智能-计算机视觉

唐宇迪：图像处理与计算机视觉基础分享，其中包含超多实战项目：信用卡数字识别项目、文档扫描OCR识别项目、全景图像拼接项目、停车场车位识别项目、答题卡识别判卷项目、新闻数据集文本分类项目、基于CNN搭建图像识别模型项目等实战项目

前言

前面一至三章为基础环境配置部分，这里不做过多讲解和记录，有需要的同学可以自行CSDN。

4、图像的基本操作

计算机图像是由很多个像素点组成的，这些像素点通常以矩阵形式排列，这个矩阵就表示着你这个图像的一个大小
在这里插入图片描述

数据读取-图像

cv2.IMREAD_COLOR:彩色图像
cv2.IMREAD_GRAYSCALE:灰度图像

import cv2	#opencv读取的格式是BGR
import numpy as np

img = cv2.imread('cat.jpg')		#读取图像的函数

详细请参考：cv2 imread()函数

#图像的显示，也可以创建多个窗口
cv2.imshow('image',img)
#等待时间，毫秒级，参数为0表示按任意键终止，参数为1000的话表示1000ms就终止
cv2.waitKey(0)
cv2.destroyAllWindows()

为了方便，我们可以编写一个函数来展示图像

def cv_show(name,img):
	cv2.imshow(name,img)
	cv2.waitKey(0)
	cv2.destroyAllWindows()

接下来让我们看一下图像的一些属性(这里的img都是拿上述img举例)

img.shape
#执行结果为：(414,500,3)，其中，从左到右依次表示：w（宽度），h（高度），c（3为3通道的意思，这里指的的BGR三通道）

现在我们更改一下图像的颜色属性为灰度图试试

img = cv2.imread('cat.jpg',cv2.IMREAD_GRAYSCALE)
img.shape
#执行结果为 (414,500)

关于图像的保存这里也简单提及一下：

#保存
cv2.imwrite('你要保存的路径和名字',img)

其他的图像的属性还有：

img.dtype
img.size
type(img)

数据读取-视频

cv2.VideoCapture可以捕获摄像头，用数字来控制不同的设备，例如0,1。
如果是视频文件，直接指定好路径即可。
其实视频也就是由一帧帧静止的图片播放来的。

vc = cv2.VideoCapture('test.mp4')
#检查是否打开正确
if vc.isOpened():
	#vc.read会从视频中一帧一帧去读取图片，然后会返回两个值：open，frame，
	#open是个布尔类型返回值，frame是指当前这一帧的图像
	open,frame = vc.read()		
else:
	open = False

#如果视频打开正常我就开始对一帧一帧的图像进行处理
while open:
    ret,frame = vc.read()
    if frame is None:
        break
    if ret == True:
        # cv2.cvtColor(img, p2)是颜色空间转换函数，img是需要转换的图片，p2是转换成何种格式。
        # cv2.COLOR_BGR2RGB 将BGR格式转换成RGB格式
        # cv2.COLOR_BGR2GRAY 将BGR格式转换成灰度图片
        gray = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
        cv2.imshow("颜色转换后灰度视频流",gray)
        if cv2.waitKey(10) & 0xFF == 27:
            break
vc.release()
cv2.destroyAllWindows()

截取部分图像数据

"""
截取部分图像数据
其中的img[200:300,100:400]指的是截取的区域
"""
img = cv2.imread('1.jpg')
cut_up = img[200:300,100:400]

详细可参考：图像处理基础

颜色通道提取

刚才我们也说了，opencv中颜色通道为BGR，我们可以用cv2.split把BGR三个通道给分别切分开来，当然，我们也可以将它们再通过cv2.merge合并起来

b,g,r = cv2.split(img)
img = cv2.merge((b,g,r))

那如何看各个通道长什么样子呢？

#我们只保留R通道试试，将其他两个通道的值都置为0
cur_img = img.copy()
cur_img[:,:,0] = 0		#还记的我们的img的shape吗？(w,h,c),c为三色通道BGR，此处的意思即为让B通道亮度值都为0
cur_img[:,:,1] = 0		#此处的意思即为让G通道亮度值都为0
cv_show('R',cur_img)

边界填充

什么是边界填充？简单来说就是给图像的边缘填充一些东西，例如给图像的上下左右添加一些边框。

函数介绍
cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)

BORDER_REPLICATE：复制法，也就是复制最边缘像素。
BORDER_REFLECT：反射法，对感兴趣的图像中的像素在两边进行复制例如：fedcba|abcdefgh|hgfedcb
BORDER_REFLECT_101：反射法，也就是以最边缘像素为轴，对称，gfedcb|abcdefgh|gfedcba
BORDER_WRAP：外包装法cdefgh|abcdefgh|abcdefg
BORDER_CONSTANT：常量法，常数值填充，需要在函数中填入常数参数。

由于篇幅原因这里不过多赘述，之后再做详细说明，效果可见：
OpenCV–图像边界填充

数值计算与图像融合

由于篇幅原因这里只提供一些常见的函数，详细请自行查找

cv2.addWeighted 函数是将两张相同大小，相同类型的图片融合的函数
cv2.resize 调整图片尺寸，大小等等

YuZou 邹宇

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
跟着大白小浪一起学——人工智能-计算机视觉（一）

跟着大白小浪一起学——人工智能-计算机视觉学习网站前言4、图像的基本操作数据读取-图像学习网站B站学习网址：人工智能-计算机视觉唐宇迪：图像处理与计算机视觉基础分享，其中包含超多实战项目：信用卡数字识别项目、文档扫描OCR识别项目、全景图像拼接项目、停车场车位识别项目、答题卡识别判卷项目、新闻数据集文本分类项目、基于CNN搭建图像识别模型项目等实战项目前言前面一至三章为基础环境配置部分，这里不做过多讲解和记录，有需要的同学可以自行CSDN。4、图像的基本操作计算机图像是由很多个像素点组成的，
复制链接

扫一扫