php ocr识别验证码,tesserocr 简单验证码自动识别

简单文字验证码自动识别方法

前言

325ba976302de28a190719426a8b0eb2.png概述:OCR光学字符识别可以将验证码转换为电子文字,tesserocr是Python的一个OCR识别库,但是是对tesserect做的一层pythonAPI封装。我们先要安装 tesserect

然后再安装我们的 tesserocr

tesserocr 的安装

mac 下安装

先使用 Homebrew 安装 ImageMagick 和 tesserectbrew install imagemagick

brew install tesseract

brew install tesseract-lang # 语言包

再安装 tesserocr 即可pip3 install tesserocr pillow

Linux 下安装yum install -y tesseract

再安装 tesserocr 即可pip3 install tesserocr pillow

Ubuntu 下安装sudo apt-get install -y tesseract-orc libtesseract-dev libleptonica-dev

再安装 tesserocr 即可pip3 install tesserocr pillow

识别import tesserocr

from PIL import Image

image = Image.open('code.png') # 图片路径

result = tesserocr.image_to_text(image)

print(result)

图片处理参数有的时候识别不够精准,我们可以通过设置参数来修改精准度

灰度处理image = image.convert('L')

image.show

二值化处理image = image.convert('1')

image.show

如果需要单独指定二值化筏值,需要先转为灰度,在设置import tesserocr

from PIL import Image

image = Image.open('code2.jpg')

image = image.convert('L')

threshold = 127

table = []

for i in range(256):

if i < threshold:

table.append(0)

else:

table.append(1)

image = image.point(table, '1')

image.show()

result = tesserocr.image_to_text(image)

print(result)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值