win 安装 tesseract 及 python 识别验证码

本文详细介绍了在Windows上安装Tesseract OCR的过程,包括下载、配置环境变量、设置TESSDATA_PREFIX以及解决安装过程中遇到的问题。同时,讲解了如何使用Python的pytesseract库进行图片文字识别。
摘要由CSDN通过智能技术生成

在学习python网络数据采集一书中,学习到11章——图片处理时,作者介绍了tesseract-ocr光学文字识别这一内容,随后在安装该工具的过程中遇到了很多的问题,在这里将其全部罗列出来,供读者参考。

1.下载

  • 下载地址:链接: https://pan.baidu.com/s/11TBKT_H_z0mRrDGxFKvJPQ 密码: qj74
    下载后按默认下一步安装即可

2.配置环境变量

  • esseract实际上是在windows命令行模式下使用的工具,因此需要配置其环境变量。配置方法如下:打开我的电脑属性——更改设置——高级——环境变量,在系统变量中添加tesseract的路径。
    在这里插入图片描述
  • win+R输入cmd打开命令行工具,输入tesseract -v,出现如下说明即配置成功
    在这里插入图片描述

3、TESSDATA_PREFIX变量设置

  • 到这一步环境变量配置完成,但是此时直接使用tesseract对图片进行识别会提示错误
    例如,在cmd窗口中使用命令tesseract 1.jpg res
    出现如下的错误提示

Error ope

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值