Python图像操作

Zerg Wang

已于 2022-02-22 16:46:29 修改

阅读量996

点赞数 1

分类专栏： Python 文章标签：计算机视觉图像识别 python pytorch cv

于 2020-04-03 22:06:55 首次发布

转载请注明出处，谢谢合作！

本文链接：https://blog.csdn.net/zerg_wang/article/details/105302227

版权

6 篇文章 1 订阅

订阅专栏

常用的图像操作库有PIL，opencv以及torchvision下的transforms等。

opencv

import cv2

img = cv2.imread("1.jpg")
cv2.imwrite('1.png', img)

其中，读入图像时，可以指定读入方式：

img = cv2.imread('1.jpg', 0)

图像路径后的标志位表示图像读入方式，0代表处理为灰度图，1代表普通的RGB形式（默认为1）。还有-1表示在RGB的基础上再读入图像Alpha通道。

cv2.imshow('title',img)
cv2.waitKey()

会生成一个图像展示窗口，第一个参数为窗口标题。

cv2.waitKey()的作用是：生成窗口，按任意键关闭窗口。

from PIL import Image

img = Image.open('1.jpg')
img.save('2.jpg')

print(img.size) #尺寸
print(len(img.split())) #通道数

PIL转numpy：

import numpy as np
n_img = np.array(p_img)

numpy转PIL：

from PIL import Image
p_img = Image.fromarray(n_img)

RGB转灰度图：
（gray即灰度图）

from PIL import Image
img = Image.open(img_path)
gray = img.convert('L')

from torchvision import transforms

组合多个操作，逐一应用。

例如将图像放缩后再裁剪：

changeSize = transforms.Compose([
    transforms.Resize((64, 64)),
    transforms.CenterCrop((50, 50)),])
   
img = changeSize(img)

参数：(h, w)，例如：

centerCrop = torchvisiontransforms.CenterCrop((768, 1024))
image = centerCrop(image)

原图最中间的1024×768个像素会被取出，图像其他部分会被舍弃。当然，这个参数可以大于原图的尺寸。

将numpy或PIL格式的图像转为tensor的形式，在转换的时候，会对图像进行归一化处理（即像素值除以255）。

关注

专栏目录