python 中文识别 不用tesseract_Python——验证码识别 Pillow + tesseract-ocr

本文介绍了如何使用Python的Pillow库进行图片验证码的处理,包括灰度化、二值化和降噪步骤,以实现中文验证码的识别。通过灰度处理将彩色图片转为灰度,然后进行二值化处理,最后通过降噪方法去除干扰信息,为文字识别做准备。实现实例中,使用了PIL库进行图像操作,并结合pytesseract进行文字识别。
摘要由CSDN通过智能技术生成

简介

图片验证码识别的可以分为几个步骤,一般用 Pillow 库或 OpenCV 来实现,这几个过程是:

灰度处理&二值化

降噪

字符分割

标准化

识别

灰度化:在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫做灰度值,因此,灰度图像每个像素值只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。

二值化:二值化可以把灰度图片转换成二值图像,把大于某个临界灰度值的像素灰度设置为灰度极大值,把小于这个值的像素灰度设为灰度极小值,从而实现二值化。

降噪就是把不需要的信息通通去除,比如背景,干扰线,干扰像素等等,只留下需要识别的字符,让图片变成2进制点阵,方便代入模型训练。

灰度处理:

灰度化:在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫做灰度值,因此,灰度图像每个像素值只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。

from PIL import Image # 用于打开图片和对图片处理

def img_to_gray(path):

"""

图片转灰度

:param path:

:return:

"""

img = Image.open(path)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值