php开源ocr,GitHub - thinkphpdev/PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识...

简介

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。

近期更新

2020.5.30,模型预测、训练支持Windows系统,识别结果的显示进行了优化

2020.5.30,开源通用中文OCR模型

2020.5.30,提供超轻量级中文OCR在线体验

特性

超轻量级中文OCR,总模型仅8.6M

单模型支持中英文数字组合识别、竖排文本识别、长文本识别

检测模型DB(4.1M)+识别模型CRNN(4.5M)

多种文本检测训练算法,EAST、DB

多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE

支持的中文模型列表:

模型名称

模型简介

检测模型地址

识别模型地址

chinese_db_crnn_mobile

超轻量级中文OCR模型

chinese_db_crnn_server

通用中文OCR模型

也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。

超轻量级中文OCR以及通用中文OCR体验

d3de93b4fa1bf85375f9710aff6b86e8.png

上图是超轻量级中文OCR模型效果展示,更多效果图请见文末超轻量级中文OCR效果展示和通用中文OCR效果展示。

1.环境配置

请先参考快速安装配置PaddleOCR运行环境。

2.inference模型下载

(1)超轻量级中文OCR模型下载

mkdir inference && cd inference

# 下载超轻量级中文OCR模型的检测模型并解压

wget https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar && tar xf ch_det_mv3_db_infer.tar

# 下载超轻量级中文OCR模型的识别模型并解压

wget https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar && tar xf ch_rec_mv3_crnn_infer.tar

cd ..

(2)通用中文OCR模型下载

mkdir inference && cd inference

# 下载通用中文OCR模型的检测模型并解压

wget https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db_infer.tar && tar xf ch_det_r50_vd_db_infer.tar

# 下载通用中文OCR模型的识别模型并解压

wget https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_infer.tar && tar xf ch_rec_r34_vd_crnn_infer.tar

cd ..

3.单张图像或者图像集合预测

以下代码实现了文本检测、识别串联推理,在执行预测时,需要通过参数image_dir指定单张图像或者图像集合的路径、参数det_model_dir指定检测inference模型的路径和参数rec_model_dir指定识别inference模型的路径。可视化识别结果默认保存到 ./inference_results 文件夹里面。

# 设置PYTHONPATH环境变量

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值