计算机视觉快速入门一 —— 图像基本操作(一)

计算机视觉快速入门一 —— 图像基本操作(一)

1.数据读取

cv2.IMREAD_COLOR:彩色图像
cv2.IMREAD_GRAYSCALE:灰度图像

  • 读取:img=cv2.imread('cat.jpg) # img是一个三维矩阵
  • 展示:cv2.imshow(‘imagename’,img)
  • 等待显示:cv2.waitKey(0) cv2.destroyAllWindows()
  • img.shape # (height,width,w)
  • 灰度图:img=cv2.imread(‘cat.jpg’,cv2.IMREAD_GRAYSCALE)
  • 保存:cv2.imwrite(‘mycat.png’,img)
  • type(img)
  • img.size #像素点数
  • img.dtype
import cv2 #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 
%matplotlib inline 

img=cv2.imread('cat.jpg')
#图像的显示,也可以创建多个窗口
cv2.imshow('image',img) 
# 等待时间,毫秒级,0表示任意键终止
cv2.waitKey(0) 
cv2.destroyAllWindows()

def cv_show(name,img):
    cv2.imshow(name,img) 
    cv2.waitKey(0) 
    cv2.destroyAllWindows()

img.shape #(414, 500, 3)

#转灰度图
img=cv2.imread('cat.jpg',cv2.IMREAD_GRAYSCALE)
img #二维矩阵
img.shape #(414,500)

#图像的显示,也可以创建多个窗口
cv2.imshow('image',img) 
# 等待时间,毫秒级,0表示任意键终止
cv2.waitKey(10000) 
cv2.destroyAllWindows()

#保存
cv2.imwrite('mycat.png',img)
type(img) #numpy.ndarray
img(size) #207000
img.dtype # dtype('uint8')

2.数据读取-视频

cv2.VideoCapture可以捕获摄像头,用数字来控制不同的设备,例如0,1。如果是视频文件,直接指定好路径即可。

  • vc = cv2.VideoCapture(‘test.mp4’)
  • gray =cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
vc = cv2.VideoCapture('test.mp4')

# 检查是否打开正确
if vc.isOpened(): 
    oepn, frame = vc.read()
else:
    open = False

while open:
    ret, frame = vc.read()
    if frame is None:
        break
    if ret == True:
        gray = cv2.cvtColor(frame,  cv2.COLOR_BGR2GRAY)
        cv2.imshow('result', gray)
        if cv2.waitKey(100) & 0xFF == 27:
            break
vc.release()
cv2.destroyAllWindows()

3.图像操作

  • 颜色通道提取:b,g,r=cv2.split(img)
  • 图像融合:img=cv2.merge((b,g,r))
#截取部分图像数据
img=cv2.imread('cat.jpg')
cat=img[0:50,0:200] 
cv_show('cat',cat)

#颜色通道提取
b,g,r=cv2.split(img)
r.shape #(414,500)二维数组
img=cv2.merge((b,g,r))
img.shape #(414,500,3)
# 只保留R
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show('R',cur_img)
# 只保留G
cur_img = img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show('G',cur_img)
# 只保留B
cur_img = img.copy()
cur_img[:,:,1] = 0
cur_img[:,:,2] = 0
cv_show('B',cur_img)

4.边界填充

#边界填充
top_size,bottom_size,left_size,right_size = (50,50,50,50)

replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)
import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

在这里插入图片描述

  • BORDER_REPLICATE:复制法,也就是复制最边缘像素。
  • BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb
  • BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
  • BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg
  • BORDER_CONSTANT:常量法,常数值填充。

5.数值计算

img_cat=cv2.imread('cat.jpg')
img_dog=cv2.imread('dog.jpg')
img_cat2= img_cat +10 
img_cat[:5,:,0]
img_cat2[:5,:,0]
#相当于% 256
(img_cat + img_cat2)[:5,:,0] 
cv2.add(img_cat,img_cat2)[:5,:,0]

6.图像融合

img_cat + img_dog
img_cat.shape #(414, 500, 3)
img_dog = cv2.resize(img_dog, (500, 414))
img_dog.shape #(414, 500, 3)
res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)
plt.imshow(res)
res = cv2.resize(img, (0, 0), fx=4, fy=4)
plt.imshow(res)
res = cv2.resize(img, (0, 0), fx=1, fy=3)
plt.imshow(res)
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python机器视觉是指使用Python编程语言进行图像处理和计算机视觉任务的领域。它涵盖了图像处理、图像分析、目标检测、图像识别等多个方面。在Python中,有一些常用的机器视觉库可以使用,如OpenCV、PIL等。通过这些库,我们可以读取、处理和分析图像数据,实现各种视觉任务。 在引用\[1\]中提到的代码中,使用了OpenCV库来打开并显示一张图片。首先,通过`import cv2`导入OpenCV库。然后,使用`cv2.imread("image1.png")`读取名为"image1.png"的图片。最后,使用`cv2.imshow("title", image)`显示图片窗口。 在引用\[2\]中提到了Python机器视觉的一些基础概念和编程基础知识,包括缩进、if语句、函数、类、循环、基础数据类型和基础数据结构等。 对于初学者来说,建议安装Anaconda发行版,它集成了常用的Python模块,并配置了方便的开发环境,如spyder和jupyter Notebook。可以从Anaconda官网下载适合自己操作系统的版本进行安装。同时,也可以通过搜索了解如何安装Python机器视觉模块。 #### 引用[.reference_title] - *1* *2* *3* [python机器人视觉编程——入门篇(上)](https://blog.csdn.net/kanbide/article/details/124926698)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值