使用PIL库获取图片的二进制/01文本

最新推荐文章于 2023-11-25 20:43:33 发布

Leviathan_Four

最新推荐文章于 2023-11-25 20:43:33 发布

阅读量2.9k

点赞数 1

分类专栏：笔记文章标签： python 机器学习图像识别数据处理

本文链接：https://blog.csdn.net/weixin_45755831/article/details/122004205

版权

笔记专栏收录该内容

38 篇文章

订阅专栏

前言

今天看了看KNN算法的手写数字识别，想着自己能不能创造个数据，试试看能不能识别。然后我去网上百度如何获得图片的01文本。发现很多代码效果不是很好，然后就有了今天这篇博客。

本文需要安装pillow库，安装的命令很简单。

cmd模式
pip install pillow
conda模式 
conda install -n 环境名 pillow

正文

首先，我们知道图片的RGB每个的值最大都是255。然后PIL库的Image库有个函数getpixel(),这个函数会返回当前图片像素点的像素值，返回值为一个列表。

getpixel()的使用方法

我们可以看到源码中注释，关于返回值的部分：
像素值。如果图像是多层图像，则此方法返回一个元组
在这里插入图片描述

from PIL import Image
im = Image.open('8_0.jpg')
# 获取像素列表
color = im.getpixel((j, i))
print(color)

我们可以看到输出会是一个tuple。

(255, 255, 255)

获得图片的01/二级制文本

如果我们有一个32像素X32像素的图片。如下：

在这里插入图片描述我们可以使用下面的代码:

from PIL import Image
# 打开
im = Image.open('8_0.jpg')

width = im.size[0]
height = im.size[1]

fh = open('8_0.txt', 'w')
print(width, height)
for i in range(height):
    for j in range(width):
        # 获取像素点颜色
        color = im.getpixel((j, i))
        colorsum = color[0] + color[1] + color[2]
        if (colorsum <= 383):
            fh.write('1')
        else:
            fh.write('0')
    fh.write('\n')
fh.close()

文本：

00000000000000000000000000000000
00000000000000011110000000000000
00000000000011111111100000000000
00000000001111111111111000000000
00000000011111111111111000000000
00000000111110000000111100000000
00000001111000000000011100000000
00000001110000000000011110000000
00000001110000000000011110000000
00000011110000000000011110000000
00000011110000000000111100000000
00000001111000000000111100000000
00000001111111000001111000000000
00000000111111111111110000000000
00000000001111111111100000000000
00000000000001111111100000000000
00000000000111111111110000000000
00000000001111110011110000000000
00000000011111000000111000000000
00000000111100000000111000000000
00000000111000000000011100000000
00000001110000000000011100000000
00000001110000000000011100000000
00000001110000000000011100000000
00000001111000000000111000000000
00000000111111111111111000000000
00000000111111111111110000000000
00000000001111111111100000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000

Notes:
1、如果是做手写数字识别的小伙伴，建议使用PS建立32×32的图片，如果直接用画图或者截图之类的方法，获取的像素会比较大，导致运算量比较大，还可能和你的教程的代码种的规格不一样，需要修改，很麻烦。
2、效果不好可能的原因。其实我的代码和网上大部分都相似，但是我只修改了一个地方，就是判断colorsum的值，经过输出求证可能得出，图片中为黑色的地方，基本上不会是0，而是位于0~300之间，这里我使用了255*3/2≈383，这样判断的结果就比较好了。当然如果是其他的图像使用我的383可能就不太好了，这时候就需要适当修改数值了。