小白成长之路----Opencv and YOLO(day2

   每天一遍:立志成为技术大佬,迎娶白富美,从此走上人生巅峰(dog

  经过昨天的学习,我已经成功配置好了使用环境,那么今天我打算从P4-P8开始正式进行学习,望在下个月之前争取学完所有内容,加油!!!(此篇基于【2022B站最好的OpenCV课程推荐】OpenCV从入门到实战 全套课程(附带课程课件资料+课件笔记)图像处理|深度学习人工智能计算机视觉python+AI_哔哩哔哩_bilibili进行学习分享,侵权请联系我删除)

Day2

2.1 计算机眼中的图像

2.10颜色:

 简单来讲,目前大多数彩色图像均由3个通道构成,分别为R(红)G(绿),B(蓝),其中0-255指的是色块对应的亮度情况,0代表黑色,255代表白色,也就是说,数字越大,亮度越高。

那么这个矩阵又是什么意思呢?

矩阵其实代表的就是你图像的一个大小,就比如我截取的这一张图,就是1325*427,那么他就是有1321*427个像素点。表示为[1321,427,3],其中3表示为有三个通道。

2.11图片的读取: 

按照老师操作,在读取图片时,我发现这样的报错。我估计可能是因为图片保存的路径没有与代码保存路径一致,所以我尝试将代码与图片给放置在desktop文件夹中,便可以进行图片的读取了。

NameError                                 Traceback (most recent call last)
<ipython-input-1-77a7949ba908> in <module>()
----> 1 img
NameError: name 'img' is not defined

以下是我的程序运行后的图片: 

尤其要注意的是 cv2读取的图片格式是BGR,而不是RGB,这点需要多多注意。

在输出的结果中(out)我们可以发现 ,有三个中括号,这代表有三个维度[h,w,c]

1.11图片的显示

我们对图片进行显示,值得注意的是cv2.waitKey(0),指的是按任意键退出。

cv2.imshow('image',img) #显示窗口的名字,图片的名字
cv2.waitKey(0)
cv2.destroyAllWindows()

以下是我的程序运行后的图片: 

 

对代码进行封装,并加入img.shape,获取(h,w,c) 

def cv_show(name,img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
img.shape

 以下是我的程序运行后的图片: 

 此时获取的图像为彩色图,那若想获取灰度图像,则需要输入下面的代码

img = cv2.imread('name',cv2.IMREAD_GRAYSCALE) #cv2.IMREAD_COLOR为彩色
img

代码运行结果: 

 

此时我们可以发现,只有2个中括号,代表只有1个通道,且值是从0-255,那么就说明成功转化为灰度图像了。

 最后进行保存

cv2.imwrite('mycat.png',img)

2.2 视频的读取与处理

 

视频的读取与处理基本与图像类似,因为视频的每一帧实际上就是一张图片,我们需要对每一帧进行处理。以下是代码:

vc = cv2.VideoCapture('2.MP4') #是cv2  不是cv
#检查是否打开正确
if vc.isOpened():
    open, frame = vc.read() #open为2个值 F和T  对视频帧数进行拆帧 对每一帧进行操作
else:
    open = False
while open:
    # 只要视频文件能够打开 open == True
    ret, frame = vc.read()

    # 如果成功读取帧
    if ret:
        # 将帧转换为灰度图像
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        
        # 显示灰度图像
        cv2.imshow('result', gray)

        # 检查是否按下键盘上的Esc键,如果按下则退出循环
        if cv2.waitKey(100) & 0xff == 27:
            break

# 释放视频捕获对象和关闭显示窗口
vc.release()
cv2.destroyAllWindows()

代码结果展示:

tip:由于是新手,我将cv2.VideoCapture打成了cv.VideoCapture,导致我一度怀疑我的环境配置出现了问题。。。

2.3 ROI区域

首先需要用到3个函数,第一个是颜色通道提取cv2.split(img)
                                      第二个是合并cv2.merge(img)

                                      第三个是展示函数cv_show(name, img)(该函数需要自己写,前面有)

2.31分割和合并
img=cv2.imread(name)
cat=img[0:50,0:100]
cv_show('cat', cat)
#这个错误是由于代码中使用了全角括号(())而不是半角括号(())导致的

b,g,r=cv2.split(img) #分割
b/g/r
img=cv2.merge((b,g,r)) #合并
cv_show('cat',img)

代码运行展示:1.分割 2.合并

     

2.32保留颜色  

需要注意的是,该函数是bgr,而不是rgb,进行使用是需要注意一下。

代码展示:

img=cv2.merge((b,g,r))
img.shape
cv_show('cat',img)

#只保留R
cur_img = img.copy()#B = 0, G = 1, R = 2
cur_img[:,:,0] = 0
cur_img[:,:,2]= 0
cv_show('G',cur_img)#若想保留其他颜色 只需要修改cur_img中的参数就ok了

运行结果:

2.4 边界填充

对于图片的放大,因为是对图片上下左右同时放大(若想不为同时,则只需要修改对应参数,或者删除变量就可以了),所以需要定义4个变量并设定数值,之后在使用不同的边界填充方式生成新图像,在导入matplotlib,在进行展示。

五种填充方式:
1.BORDER REPLICATE:复制法,也就是复制最边缘像素。
2.BORDER REFLECT:反射法,对感兴趣的图像中的像察在两边进行复制,例如:fedcbalabcdefghlhgfedcbBORDER
3.REFLECT 101:反射法,也就是以最边缘像素为轴,对称,gfedcblabcdefghlgfedcbaBORDER
4.WRAP:外包装法cdefghlabcdefghlabcdefg
5.BORDER CONSTANT:常量法,常数值填充

但是由于我可能是cv版本问题,REFLECT 101这个方法并未成功运行,所以只截取了四种方法。

以下是代码及其运行结果展示:

# 定义上下左右的大小
top_size, bottom_size, left_size, right_size = (400, 50, 50, 50)

# 使用不同的边界填充方式生成新图像
# 1. 使用 BORDER_REPLICATE 边界填充方式
replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)

# 2. 使用 BORDER_REFLECT 边界填充方式
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REFLECT)

# 3. 使用 BORDER_WRAP 边界填充方式
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_WRAP)

# 4. 使用 BORDER_CONSTANT 边界填充方式,并指定填充值为0
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_CONSTANT, value=0)

import matplotlib.pyplot as plt

# 在子图中显示原始图像
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')

# 在子图中显示使用 BORDER_REPLICATE 边界填充方式的图像
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')

# 在子图中显示使用 BORDER_WRAP 边界填充方式的图像
plt.subplot(233), plt.imshow(wrap, 'gray'), plt.title('WRAP')

# 在子图中显示使用 BORDER_CONSTANT 边界填充方式的图像
plt.subplot(234), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

# 在子图中显示使用 BORDER_REFLECT 边界填充方式的图像
plt.subplot(235), plt.imshow(reflect, 'gray'), plt.title('REFLECT')

# 显示所有子图
plt.show()

2.5 数值计算

使用到的函数:

1.A = B+/- 数值

2.(A +/- B) #%256

3.cv2.add(A,B)#大于255 取255,小于 取自身

4.A = cv2.resize(iB,(453,376))

5.res = cv2.addWeighted(A,0.3,B,0.7,0) #后面的数字均为权重,0是偏执量

6.plt.imshow(res)

  2.51加减法

最简单的数值运算,直接对图像进行加减,但是要注意到的是,加减的图像需要保证矩阵长宽相等。

代码及运算结果展示:

1.
img_cat=cv2.imread('cat.png')
img_cat2= img_cat -10#这里用到了numpy
img_cat[:5,:,0] #只打印前五行

2.
(img_cat - img_cat2)[:5,:,0] #%256

 3.
cv2.add(img_cat,img_cat2)[:3,:,0] #大于255 取255,小于 取自身
2.52图像融合

若要对图像进行融合,同样的,图像的长宽必须相等,所以引用了img =cv2.resize(img,(384,288))

让图像的长宽一样。

最后在利用函数cv2.addWeighted(img_cat,0.3,img_2,0.7,0),对图像进行融合

使用plt.imshow(res),进行打印。

代码及运行结果:

//2024/4/26 paperccc Record

望大佬们能给我指指路,交流交流,谢谢啦!

最后我找了文件的路径,在c盘里谢谢各位大佬的知指导!

  • 26
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值