Anaconda+Pycharm下 tesserocr和pytesseract库的安装与使用 各类问题及解决方案

Anaconda下tesserocr和pytesseract库的安装与使用 各类问题及解决方案最全

第一步:安装tesserocr
1.下载安装tesseract
2.下载安装whl文件
3.下载安装语言包
4.测试
第二步:安装pytesseract库
第三步:配置pycharm

第一步:安装tesserocr

  1. 在Windows下,首先需要下载tesseract,它为tesserocr提供了支持。
    下载地址是 https://digi.bib.uni-mannheim.de/tesseract/
    进入下载页面,可以看到有各种.exe文件的下载列表,其中文件名中带有dev的为开发版本,不带dev的为稳定版本,我自己选择下载的是
    tesseract-ocr-w64-setup-v4.0.0-beta.4.20180912.exe
  2. 选择自定义安装,未进行其他操作,一路next点下去。
    PS. 本来是想选择自定义安装中的 Additional Language data(download) ,无奈下载过程总是不成功,总是提示 Download error Status of equ: Send Request Error. Click OK to continue在这里插入图片描述
  3. 将安装路径中的C:\Users\Administrator\AppData\Local\Tesseract-OCR\tessdata剪切到Anconda文件夹下
  4. 下载并安装whl文件, 下载地址为
    https://github.com/simonflueckiger/tesserocr-windows_build/releases
    安装:在cmd中切换到whl文件所在的文件夹,并输入
pip install tesseract-ocr-w64-setup-v4.0.0-beta.4.20180912

切换至whl文件的位置
5.下载语言包,下载位置
链接:https://pan.baidu.com/s/1c-fveIYnm1sQHxX9WRpUZw 提取码:9ovq
解压后将tessdata文件夹下的文件复制到:\ProgramData\Anaconda3\tessdata。
重启cmd后,命令输入如下:

tesseract --list-langs

6.配置环境变量 & 系统变量
我的电脑 →属性→高级系统设置→环境变量
环境变量
找到用户变量和系统变量 两个Path项点开,都添加刚才拷贝的Tesseract 的安装路径 C:\Users\Administrator\AppData\Local\Tesseract-OCR
系统变量
再找到系统变量,新建一个变量名称为:TESSDATA_PREFIX
值为:C:\Users\Administrator\AppData\Local\Tesseract-OCR\tessdata
**注:**设置完后记得点确定再关闭设置页面。
环境变量下用户变量 系统变量
环境变量

  1. 测试
    在cmd里面执行python命令import tesserocr,然后看能否正常导入tesserocr;
python
import tesserocr

在这里插入图片描述
参考两位博主的帖子
1.tesseract-ocr在安装过程中出现Download error以及anaconda下安装tesserocr库
2.win10 安装tesseract+tesserocr+pycharm导入tesserocr,各种问题+解决办法

第二步:安装pytesseract库

1.以下命令在conda shell窗口中执行:

conda install -c mcs07 tesseract
conda install -c jim-hart pytesseract

*执行完后base root 中已经有了pytesseract包,需要在指定虚拟环境下安装
2.在cmd shell窗口中执行

conda info -e
conda activate pytest
pip list
pip install pytesseract

3.若下载安装太慢,在cmd shell窗口中执行以下命令,添加清华镜像源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

参考博主的帖子: window10 conda 环境下安装pytesseract

第三步:配置pycharm

1.查看安装python的位置,在cmd中输入以下代码即可。

where python

2.在pycharm中导入tesserocr和pytesseract的包
打开pycharm,点击File->setting->project->Project interpreter->小齿轮->add->选择环境位置->apply->ok.
找到解释器Project interpreter,然后点击小齿轮,再点add,把你安装了tesserocr的解释器添加到这里就行了,选择环境位置,最后点击apply后点ok。

参考博主的帖子:在pycharm中使用tesseract

第四步:pytesseract的语法

测试图片

在pycharm中输入以下代码,测试对以上图片中的文字识别能力。

#coding=utf-8
from PIL import Image
import pytesseract
#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('xxx.png'),lang='chi_sim')
print(text)

参考博主的帖子:python识别图片中的汉字

  • 1
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
AnacondaPyCharm和PyTorch都是在Python开发中非常实用的工具。下面将分别介绍它们的安装。 首先,Anaconda是一个数据科学的IDE,含有许多科学计算Python包。在其官方网站(https://www.anaconda.com/products/individual)上下载对应操作系统的安装包,双击打开安装即可。在安装时需要进行一些设置,比如选择安装路径和添加环境变量等。安装完成后,可以在Anaconda的Navigator中找到安装好的Python环境,并在其中安装需要的包。 其次,PyCharm是一个受欢迎的Python开发工具,它有专业版和社区版两个版本。在其官方网站(https://www.jetbrains.com/pycharm/download/)上下载对应版本的安装包,双击打开安装即可。在安装时同样需要进行一些配置,比如选择安装路径、添加环境变量等。安装完成后,可以在PyCharm中打开Anaconda安装Python环境,方便地进行Python开发。 最后,PyTorch是一个深度学习框架,安装流程有点复杂。首先需要安装Anaconda,然后在其中创建一个新的环境。在命令行上输入以下命令即可安装PyTorch: ``` conda install pytorch torchvision torchaudio cpuonly -c pytorch ``` 其中,包含了PyTorch的核心模块torch,以及一些常用的扩展模块torchvision和torchaudio。如果希望使用GPU进行计算,则需要额外安装对应的CUDA工具。 总的来说,AnacondaPyCharm和PyTorch都是非常实用的工具,在安装时需要注意一些配置,这些工具能够提高Python开发的效率和学习深度学习的体验。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值