easyocr快速安装及图片文字提取演示(小语种)

前几天工作中需要用到图片识别,由于从图片中提取的文字是小语种越南语,了解了几种图片识别库之后决定使用easyocr(支持80+种语言)来进行文字提取,easyocr的介绍可详见官网:https://github.com/JaidedAI/EasyOCR,
想要使用该图片识别库的童鞋,可以先在demo(https://www.jaided.ai/easyocr/)上试验一下,看看自己的图片在demo上识别的准确度:
在这里插入图片描述
一,easyocr安装:
安装easyocr之前最好安装pytorch,笔者是windows环境,没有显卡,pytorch官网https://pytorch.org/:
在这里插入图片描述
如图,需要安装Torch,Torchvision和torchaudio。然而如果直接pip安装会极其地慢,直接pip install easyocr也会极其地慢,甚至readed time out 下载失败,这里建议直接使用清华镜像源安装:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple easyocr
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torch
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torchvision
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torchaudio

二,下载easyocr语言模型
在网页https://www.jaided.ai/easyocr/modelhub/查看语言模型包,可以将文字检测模型(craft)包以及常用的英文和简体中文包提前下载:
在这里插入图片描述
之后将zip包和解压后的.pth文件都放在C:\Users\用户名.EasyOCR\model路径,注意需要将zip包也放到该路径下,否则运行代码的时候会出错:
在这里插入图片描述
三,运行示例代码:

import easyocr

reader = easyocr.Reader(['vi'],gpu=False)     # 没有cpu的话需要加上gpu=False
result = reader.readtext('1_00.jpg')
print(result)

由于笔者需要的是越南语识别,模型界面(https://www.jaided.ai/easyocr/modelhub/)未直接提供越南语的语言模型包(准确的来说是笔者不知道哪个语言模型对应越南语),所以还是需要运行时下载语言包,运行时的下载界面如下:
在这里插入图片描述
第一次运行会比较慢,之后再执行脚本就不会再提醒下载模型了,会直接输出如下:
在这里插入图片描述
可以看到文字中的图片准确识别啦
在这里插入图片描述

  • 4
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值