- 本文章主要对上一期生成的验证码进行识别前的预处理
- 观察图像
![](https://i-blog.csdnimg.cn/blog_migrate/931e905d6a4a0218aa58299cb6643051.png)
- 因为干扰颜色太多,首先需要对图像进行去噪,代码如下
阈值在上期的代码中选择150比较适合
def Binarized(Image,Threshold):
'''
用二分法做判别 处理每一个点
:param Image:原始图片
:param Threshold:阈值
'''
ImgNew=Image.crop()
Pixels = ImgNew.load()
(Width, Height) = ImgNew.size
for i in xrange(Width):
for j in xrange(Height):
if Pixels[i, j] > Threshold: # 大于阈值的置为白色,否则黑色
Pixels[i, j] = 255 # 白色
else:
Pixels[i, j] = 0 # 黑色
return ImgNew
结果如下
![](https://i-blog.csdnimg.cn/blog_migrate/c13eff10a1914b2d941735b0217f81d8.png)
- 切割,对图片研究发现,每幅图字符都是在20-30,40-50,60-70,80-90中。所以把图片切割就可以得到每个字符。
def get_x_data(im):
imData=array(im)
img_1=imData[:,20:30]
img_2=imData[:,40:50]
img_3=imData[:,60:70]
img_4=imData[:,80:90]
return [img_1,img_2,img_3,img_4]