计算机视觉python图片处理(图片读取)
(待完成)
第一章 图片读取
第二章 图片显示与保存
更新:最新版的imageio.imread现在已经被弃用,推荐使用使用imagio.v2.imread
文章目录
前言
在计算机视觉领域中,第一步操作是对图片数据的读取,一般使用numpy进行存储,再根据需要转化为tensor,本文介绍了多种图片读取方法。
python编程环境一般使用anaconda构建,支持Windows、Linux、macOS操作系统,本文默认使用anaconda环境进行依赖包的安装。如果还没有使用anaconda,推荐使用anaconda,比python默认的venv要方便好用。
anaconda官方网站
需要提醒的是,国内环境想要更快捷的使用anaconda,需要更换源,我一般使用的清华源,也可以使用阿里源等。
清华源
阿里源
本文不讲解anaconda的安装和使用,可以自行搜索相关使用教程,网上有很多。当然因为博主使用anaconda已经很长时间了,有什么问题的话可以直接评论或者私聊我,我看到会及时回复。
一. opencv
1. 安装opencv
在anaconda中创建一个虚拟环境后,可以使用conda和pip两个包管理,绝大多数外部依赖包推荐使用conda安装,但是opencv是个例外,我实际使用发现使用pip安装比较快捷,不存在找不到包的情况。
pip安装:
pip install opencv-python
conda安装
conda install opencv
2. 使用
导入包cv2,直接读取图片为numpy,图片的通道为:(H, W, C)。
需要特别注意的是cv2默认的通道顺序是BGR,跟我们常规的RGB顺序不一致,在进行图片处理时,需要注意这一点,进行相应的处理。
import cv2
img_cv2 = cv2.imread('beijing.jpg')
print(type(img_cv2))
print(img_cv2.shape)
print(img_cv2.dtype)
# output:
<class 'numpy.ndarray'>
(667, 1000, 3)
uint8
二. imageio
1. 安装imageio
conda安装
conda install imageio
2. 使用
导入包imageio,读取图片格式为imageio.core.util.Array,需要转化为numpy,图片的通道为:(H, W, C)。
import imageio
import numpy as np
img_imageio = imageio.v2.imread('beijing.jpg')
img_np = np.array(img_imageio)
print(type(img_imageio))
print(type(img_np))
print(img_np.shape)
print(img_np.dtype)
# output
<class 'imageio.core.util.Array'>
<class 'numpy.ndarray'>
(667, 1000, 3)
uint8
三. scipy
这个库读取图片方法已经被弃用,官方建议使用imageio,这里也不介绍,使用弃用的方法需要较早的包,可能会出现意想不到的问题。
四. pillow读取图片
1. 安装pillow
conda安装
conda install pillow
2. 使用
导入包PIL.Image,读取图片格式为PIL.JpegImagePlugin.JpegImageFile,需要转化为numpy,图片的通道为:(H, W, C)。
from PIL import Image
import numpy as np
img_pil = Image.open('beijing.jpg')
img_np = np.array(img_pil)
print(type(img_pil))
print(type(img_np))
print(img_np.shape)
print(img_np.dtype)
# output
<class 'PIL.JpegImagePlugin.JpegImageFile'>
<class 'numpy.ndarray'>
(667, 1000, 3)
uint8
这个方法在pycharm中会有一个警告,如下:
好像并不影响什么,但是看到警告就很难受,也没有找到去除警告的解决方法。
五. scikit-image
1. 安装scikit-image
conda安装
conda install scikit-image
2. 使用
导入包skimage.io,读取图片为numpy,图片的通道为:(H, W, C)。
from skimage import io
img_skimage = io.imread('beijing.jpg')
print(type(img_skimage))
print(img_skimage.shape)
print(img_skimage.dtype)
# output
<class 'numpy.ndarray'>
(667, 1000, 3)
uint8
总结
以上就是今天要讲的内容,本文仅仅简单介绍了python中几种图片都去的方法,而大量的操作需要查询相关文档。这里,我将数据统一处理成numpy的格式,需要再次提醒的是opencv的通道是BRG,其他方法都是RGB,通道顺序在神经网络中传播是无差异的,仅在还原图片的时候需要注意。
在使用anaconda时,安装一些包可能会一起安装一系列的包,可以检查是否安装的包已经存在,不过这个不需要太注意,使用conda会提醒包已经存在。
我平常使用前两种方式cv2和imageio,我建议在一个项目中使用单一的图片处理方式,只使用cv2或者imageio,不要混用,这样可以降低出错的可能性。
在下一篇文章中,我将讲述如何使用numpy数据展示和保存图片。