python实现图片读取为向量详解

最新推荐文章于 2024-08-09 09:12:37 发布

量子莉萝

最新推荐文章于 2024-08-09 09:12:37 发布

阅读量8.7k

点赞数 2

分类专栏：初级

本文链接：https://blog.csdn.net/usernameisone/article/details/83713698

版权

初级专栏收录该内容

18 篇文章 0 订阅

订阅专栏

最近在实现cnn对于一系列图片的识别，于是就上网了解了一下图片读取的内容并整合一下。
在这里用了python3.6版本
使用的第三方库也只有numpy和PIL这两个库，所以上手很快。
下面按步骤详解：
第一：
导入这两个库

from PIL import Image
import numpy as np

然后我们先用PIL的读取图片的方法读取图片：

m = Image.open('D:\python作业\ONE\imgList//精美lomo风格美女荟萃.jpg')

其中

D:\python作业\ONE\imgList//精美lomo风格美女荟萃.jpg

是文件路径。m是临时储存对象。
因为有些图片读取后的矩阵不止gbk三种内容，所以我们可以先运行一次下面的代码

print(xl.split())

结果会是一个含有三种元素的元组，像下面这种：

(<PIL.Image.Image image mode=L size=1024x640 at 0x1E8956351D0>, <PIL.Image.Image image mode=L size=1024x640 at 0x1E8956354E0>, <PIL.Image.Image image mode=L size=1024x640 at 0x1E895635518>)

因为之前碰到过四种元素的图片，所以搞了有点久，所以建议先运行一次，然后记住图片的大小，我这里是1024*640，结果为655360，这个对之后将数组转化为向量有用。
接着用临时变量来存储上面的内容：

g,b,k = xl.split()

如果有四种只有在等号左边加临时变量即可。
然后用numpy的方法改变维度，具体用法百度numpy用法即可

np.array(g).reshape(1,655360)[0]
np.array(b).reshape(1,655360)[0]
np.array(k).reshape(1,655360)[0]

其中np.array(g)就是将之前得到的内容以数组的形式显示，然后为了之后的拼接，我用【0】提出了数组的元素
然后用numpy中拼接数组的方法来拼接:

np.concatenate((np.array(g).reshape(1,655360)[0],np.array(b).reshape(1,655360)[0],np.array(k).reshape(1,655360)[0]))

这里注意concatenate方法后面是有两个括号的，一个会报错，一定要把元素圈起来。
然后就能得到我们要的图片向量。

量子莉萝

关注

2
点赞
踩
25

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录