从零开始的OCR之旅

本文介绍了从零开始的OCR(光学字符识别)学习旅程,重点讨论了EasyOCR的环境配置问题,包括Anaconda、Pytorch和opencv-python的版本选择,并详细说明了如何下载并放置必要的模型文件。此外,还提供了使用EasyOCR读取和识别图像的Python代码示例。同时,文章提到了另一个OCR库PaddleOCR,暗示了其在OCR领域的应用和可能的优势。
摘要由CSDN通过智能技术生成

从零开始的OCR之旅

一、EasyOCR

Python中有一个不错的OCR库-EasyOCR
不过今天复现的时候遇到了不少问题,卡了一个早上希望下面能帮助后来者避开

二、环境配置

软件:Anaconda3,Pycharm
环境配置:
1、easyocr1.4.1
2、pytorch>=1.10
3、opencv-python
5.4.1.60

三、配置过程

  1. 在Anaconda上新建一个环境EasyOcr

2. 下载easyocr包

  1. 下载pytorch包
  2. 下载opencv-python包 (一定不要最新版本或者不下,由于easyocr项目本身问题可能是开源作者还没有兼容吧,会报错的)

5、去官网手动下载model包
文字检测模型(CRAFT)(必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft_mlt_25k.zip

中文(简体)模型(识别中文必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip
并放置在如下位置
在这里插入图片描述
在这里插入图片描述

6、添加环境后跑通代码
素材:
在这里插入图片描述

import easyocr
import cv2

reader = easyocr.Reader(['ch_sim','en'],gpu=False)

img=cv2.imread('./1.jpg')

result = reader.readtext(img)
with open('out.txt','w',encoding='utf-8')as f:
    for res in result:
        print(res)
        pos=res[0]
        text=res[1]
        cv2.rectangle(img,pos[0],pos[2],(160,0,0),3)
        f.write(text)
        f.write('\n')
cv2.imwrite('11.jpg',img)

在这里插入图片描述

二、PaddleOCR

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

风吹落叶花飘荡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值