【软件测试】python ocr识别库 tesserocr安装及使用

        前两天,一个同事想试下python的验证码识别,觉得有点意思,就和我讨论了一下,我当时手上有事,就叫他先弄,然后他就找度娘查到tesserocr模块可以进行验证码识别,说干就干,然后就pip install tesserocr,pip PIL,一顿操作猛如虎...
        今天正好空闲下来,我问他识别验证码弄得怎么样了,他说是网速不行,pip下不下来,然后,我去网上找了些资料,发现踩坑的人很多,于是,决定和大家分享下我的安装步骤:

        tesserocr是Python的一个OCR库,但其实是对tesseract做的一层Python API的 封装,所以他的核心是tesseract。因此,在安装tesserocr之前,我们需要先安装tesseract.
        第一步:下载并安装tesseract(tesseract-ocr是google的ocr识别引擎),下载地址: https://digi.bib.uni-mannheim.de/tesseract/,选择对应的版本安装即可,安装完成后把tesseract-ocr安装目录下的tessdata拷贝到python的安装目录下,如图所示:

其实,我们需要的只是tesseract-ocr安装目录下的tessdata,换句话说,你现在可以把tesseract-ocr卸载了!

第二步:安装tesserocr,由于tesserocr不能通过pip install tesserocr命令进行安装,因此需要下载tesserocr-2.4.0-cp37-cp37m-win_amd64.whl这个文件,下载地址: https://github.com/simonflueckiger/tesserocr-windows_build/releases

定要下载与tesseract版本对应的tesserocr,如图所示:

下载完成后,将tesserocr-2.4.0-cp37-cp37m-win_amd64.whl文件拷贝到python安装目录下,在该目录下执行cmd命令pip3 install tesserocr-2.4.0-cp37-cp37m-win_amd64.whl,如图所示:

第三步:安装PIL,这个比较简单,没啥说的,直接pip install pillow,如图所示:

至此,tesserocr安装完成,验证一下:

最后总结一下心得,遇到问题多请教多百度,但要讲究方法,不能一味照搬,多想下为什么要这么做,验证下这样做对不对,有没有更高效更简便的方法,问题解决后,还要记住踩的坑在哪里,这样将大大提高你解决问题的能力!

 

  • 6
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

怪兽男

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值