最近在实现cnn对于一系列图片的识别,于是就上网了解了一下图片读取的内容并整合一下。
在这里用了python3.6版本
使用的第三方库也只有numpy和PIL这两个库,所以上手很快。
下面按步骤详解:
第一:
导入这两个库
from PIL import Image
import numpy as np
然后我们先用PIL的读取图片的方法读取图片:
m = Image.open('D:\python作业\ONE\imgList//精美lomo风格美女荟萃.jpg')
其中
D:\python作业\ONE\imgList//精美lomo风格美女荟萃.jpg
是文件路径。m是临时储存对象。
因为有些图片读取后的矩阵不止gbk三种内容,所以我们可以先运行一次下面的代码
print(xl.split())
结果会是一个含有三种元素的元组,像下面这种:
(<PIL.Image.Image image mode=L size=1024x640 at 0x1E8956351D0>, <PIL.Image.Image image mode=L size=1024x640 at 0x1E8956354E0>, <PIL.Image.Image image mode=L size=1024x640 at 0x1E895635518>)
因为之前碰到过四种元素的图片,所以搞了有点久,所以建议先运行一次,然后记住图片的大小,我这里是1024*640,结果为655360,这个对之后将数组转化为向量有用。
接着用临时变量来存储上面的内容:
g,b,k = xl.split()
如果有四种只有在等号左边加临时变量即可。
然后用numpy的方法改变维度,具体用法百度numpy用法即可
np.array(g).reshape(1,655360)[0]
np.array(b).reshape(1,655360)[0]
np.array(k).reshape(1,655360)[0]
其中np.array(g)就是将之前得到的内容以数组的形式显示,然后为了之后的拼接,我用【0】提出了数组的元素
然后用numpy中拼接数组的方法来拼接:
np.concatenate((np.array(g).reshape(1,655360)[0],np.array(b).reshape(1,655360)[0],np.array(k).reshape(1,655360)[0]))
这里注意concatenate方法后面是有两个括号的,一个会报错,一定要把元素圈起来。
然后就能得到我们要的图片向量。