图像的二值化,就是讲图像变成黑或者白两种颜色。在很多场合,对图像进行二值化,可以忽略图像的颜色信息,背景信息,保留更加重要的形态信息。并且图像二值化处理之后,图像的信息量大为减少,处理起来也更加方便。
最简单的图像二值化的方法。就是先将图像转化为灰度图,然后再设置一个阈值。小于这个阈值的像素点调整成0,而大于这个阈值的像素点调整成255。
在Python3下,用PIL做图像处理,代码如下:
from PIL import Image
def binarizing(image, threshold=200):
pixdata = image.load()
w, h = image.size
for y in range(h):
for x in range(w):
if pixdata[x, y] < threshold:
pixdata[x, y] = 0
else:
pixdata[x, y] = 255
return image
当然,使用的时候,图像首先要转成灰度图
im = Image.open('1.png').convert('L')
这里的默认阈值是200。这样对处理已经基本是黑白的情况(例如黑白的电子书)效果比较好。但是如果要处理自带底色的(例如火车票)等,直接使用默认阈值就可能使得整张图几乎变成黑色或者白色。例如下图,图一的阈值取在160左右效果比较好,而如果取200,则图像会变成纯黑色。如果我们要处理更多种类的情况,默认阈值法根本不适用。