python图像处理库
需要关注:
1:读取的图片通道排列:RGB,BGR等等
2:照片的维度排列:(h,w,c), (c,h,w)
3:读取照片的格式是img,还是数组。img需要转换成numpy数组
opencv
import cv2
im = cv2.imread('1.jpg') # 读取出来的是ndarray,通道序列BGR,shape=(h,w,c),需要改变通道顺序为BGR
im = cv2.cvtColor(im, cv2.COLOR_BGR2RGB) # BGR转换为RBG
不同通道顺序在matplotlib.pyplt下展示的效果,matplotlib通道顺序是按照RGB显示,右边是原图。
PIL
from PIL import Image
import numpy as np
im = Image.open("hopper.ppm") # 读取文件,数据类型为PIL,需要转换成numpy计算,通道序列RGB
imgarr = np.array(im) # 将PIL格式转换成ndarray,shape=(h,w,c)
im.show() # 可打开图片查看,自动调用系统中查看图片的程序
skimage
import skimage.io as io
im4 = io.imread(file) # 数据类型ndarray,通道顺序RGB,shape=(h,w,c)
matplotlib.pyplt
import matplotlib.pyplot as plt
im3 = plt.imread(file) # 数据类型ndarray,通道顺序RGB,shape=(h,w,c)
总结
1.所有图片处理库得到的多维数组形状都是(h,w,c)即(高,宽,通道)
2.图片的通道顺序只有opencv即cv2读取出来的是BGR,其他都是RGB
3.只有PIL读取出来的文件是图像类型,其他都是ndarray,需要转换成ndarray
4.所有数据类型都为uint8即[0,255]的范围
将读取的图像数组转换成pytorch数据格式
pytorch支持(b,c,h,w)
首先需要将图像数组进行转置变成(c,h,w)
im4 = np.transpose(im4, (2, 0, 1)) # 将数组转换成(c,h,w)
t4 = torch.from_numpy(im4).view(1, im4.shape[0], im4.shape[1], im4.shape[2]) # numpy转换成tensor