python学习----网页图片文字识别(简单)

本文介绍了使用Python进行网页图片文字识别的过程,包括安装PIL、pytesseract和Tesseract-OCR,以及解决中文识别所需的语言包。通过设置环境变量和修改pytesseract.py文件,最终成功运行并识别出图片中的中文文字。
摘要由CSDN通过智能技术生成

在接触python后想对图片进行一些处理  python实现的代码很简单 但是关键在于一些包的导入 

我使用的python 软件是 pycharm  可以在setting中去下载requests这个包

在安装包PIL 和pytesseract这两个包的时候 出现了许多状况 直接影响了我的学习进度 

首先 pycharm 在setting中无法直接安装PIL这个包 但是能可以下载pillow这个包  可以说pillow是PIL的升级版吧

然后就是下载pytesseract 这个包了  我们可以选择使用pip 命令行进行下载  :  pip install pytesseract 

之后就是阻碍我进度的来了

我们下载了PIL 和pytesseract 这两个包后是无法运行程序的 或者说 他依然还会报错  是因为 我们还得下载Tesseract-ocr 这个识别引擎  网上都有安装包  在这里就不详细描述了  下载安装后  因为我们进行的是中文文字的识别 所以还得有一个中文语言包(或着 可以在安装tesseract-ocr时 直接选择下载所有的语言包 等待时间较长):chi_sim.traineddata

然后这样子运行还是会报错 首先你的配置ocr的环境 (最好放在最上面,我的老师告诉我这个还有优先级问题)

然后在path中新建一个

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值