易用的两个OCR(图像文字识别提取)开源项目

1 篇文章 0 订阅

简介

  • OCR(Optical Character Recognition)全称光学字符识别, 通俗的讲就是计算机识别图像上面的文字并且提取出来。这对提取运算速度以及识别准确率都有很高的要求。
  • 两个项目均CRNN网络结构
  • chineseocr_lite运行方式简单,PaddleOCR自定义功能强
  • 笔者运行环境:Anaconda3的Python3.7 完美运行两个项目

chineseocr_lite

# 安装模块
pip install -r ./requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
# 运行main文件运行项目
python backend/main.py 
  • 项目运行成功:
    在这里插入图片描述
  • PC界面:
    在这里插入图片描述- Android界面:
    在这里插入图片描述

PaddleOCR

  • gitHub地址:https://github.com/PaddlePaddle/PaddleOCR
  • PaddlePaddle百度多年的深度学习技术研究平台,大厂的文档也写的很全面,项目运行虽然没有像chineseocr_lite那样简单,但是文档非常清晰,也有文档可以参考自己训练模型。项目还配置了PPOCRLabel半自动化图形标注工具使用户自己添加数据集。
    在这里插入图片描述
  • 使用方式:
    在这里插入图片描述
# 1. 这里个人建议安装2.0cpu版本,笔者使用1.8.5会产生bug
pip install paddlepaddle==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple


# 2. 安装paddle, paddlehub PS:中途可能提示缺少几个模块的问题,安装即可
pip install paddle
pip3 install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple


# 3. 下载官方训练好的模型,这里建议参考官方文档: https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/deploy/hubserving/readme.md
检测模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_det
识别模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_rec
方向分类器:.\PaddleOCR_dygraph\deploy\hubserving\ocr_cls
模型库下载地址:https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/models_list.md
* 下载对应的模型后解压,然后修改hubserving目录下,ocr_det\params.py, ocr_rec\params.py, ocr_cls\params.py, ocr_system\params.py四个文件里的模型路径


# 4. 安装模块
# 安装检测服务模块:  
hub install .\deploy\hubserving\ocr_det\
# 安装分类服务模块:  
hub install .\deploy\hubserving\ocr_cls\
# 安装识别服务模块:  
hub install .\deploy\hubserving\ocr_rec\
# 安装检测+识别串联服务模块:
hub install .\deploy\hubserving\ocr_system\

# 5.开启服务
hub serving start -c .\deploy\hubserving\ocr_det\config.json
hub serving start -c .\deploy\hubserving\ocr_cls\config.json
hub serving start -c .\deploy\hubserving\ocr_rec\config.json
hub serving start -c .\deploy\hubserving\ocr_system\config.json

# 6.没有图形化界面所以只能在终端内测试
# 				测试文件					ocr_system服务地址					需测试图片路径
python .\tools\test_hubserving.py http://127.0.0.1:8868/predict/ocr_system  .\img.jpg
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值