python识别图片中的文字、数值并转文档

本文介绍了如何使用Python的pytesseract库和OCR软件进行文字和数字识别,包括安装、配置环境变量,以及识别英文、数字和中文的步骤。通过示例代码展示了如何将图片中的内容转换为文本,同时提到了识别结果的准确性问题,并指出可以借助百度AI进行更准确的中文识别。
摘要由CSDN通过智能技术生成

最近工作中有把图片中的文字和数字识别出来的需求,但是网上的图片转excel有些直接收费,有些网址每天前几次免费,后续依然要收费。想着趁周末有时间,倒腾一下,如果后续这种需求多的话,可以节省一点成本,也可以提升自己编程的能力。而且在一些爬虫登录时,字符识别自动填写也需要。
  
在这里插入图片描述
  

一、安装pytesseract库和OCR识别软件

  
打开cmd,在里面输入

pip install pytesseract

即可成功安装pytesseract库,但是这时直接调用该库会出现如下错误:
  
在这里插入图片描述
  
从网上搜索原因发现要实现图片识别,要先安装OCR识别软件:tesseract-ocr,有需要的可以到如下官网自行下载:<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿黎逸阳

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值