paddleocr 使用教程

打开从github上下载的最新PaddleOCR

先对整个项目有一个总体的认识吧:从上到下文件夹依次为:configs、deploy、doc、inference、inference_results、ppocr、PPOCRLabel、StyleText、Tools共9个文件夹。

1、configs文件夹

这个文件夹下是方向分类、文本检测、文字识别的配置文件。配置文件中描述的内容包括如何训练、模型结构、优化器、训练参数、训练数据来源等。

 

先看训练的脚本train.sh:

# recommended paddle.__version__ == 2.0.0
python3 -m paddle.distributed.launch --gpus '0,1,2,3,4,5,6,7'  tools/train.py -c configs/rec/rec_mv3_none_bilstm_ctc.yml

上面的脚本可以看出python环境使用的是python3。

paddle.distributed.launch:启动分布式运行。

--gpus:设置使用的GPU的序号(需要是多GPU卡的机器,通过命令watch nvidia-smi查看GPU的序号)。

tools/train.py:训练的启动脚本。

-c configs/rec/rec_mv3_none_bilstm_ctc.yml:配置文件,例子中的配置文件是启动识别训练的。(训练包括:文本检测训练、文本方向判断训练、文字识别训练)

配置文件目录分别对应下面的三个目录:

从上到下依次为:方向分类、文本检测、文字识别。

 

参考:2.6mnist手写数字识别之资源配置(含分布式)精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)

2、deploy文件夹

这个文件夹主要是部署相关内容,也是最后需要学习的地方,暂时可以略过。

3、doc文件夹

这个文件夹包括一些测试图片。还有一个很重要的PP-OCR论文。

4、inference文件夹

这个文件夹下放着3个模型,分别是方向分类模型、文本检测模型、文本识别模型。

5、inference_results文件夹

这个文件夹是运行脚本后生成的目录,里面存放的是结果标注显示图片。

inference.sh脚本如下:

# 预测image_dir指定的单张图像
# python tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_mobile_v2.0_det_infer/"  --rec_model_dir="./inference/ch_ppocr_mobile_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True
# 预测image_dir指定的图像集合
# python tools/infer/predict_system.py --image_dir="./doc/imgs/" --det_model_dir="./inference/ch_ppocr_mobile_v2.0_det_infer/"  --rec_model_dir="./inference/ch_ppocr_mobile_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True
# 如果想使用CPU进行预测,需设置use_gpu参数为False
python tools/infer/predict_system.py --image_dir="./doc/imgs/" --det_model_dir="./inference/ch_ppocr_mobile_v2.0_det_infer/"  --rec_model_dir="./inference/ch_ppocr_mobile_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True --use_gpu=False

6、ppocr文件夹

这个文件夹是ppocr的主干,具体内容如下:

data:数据加载、数据扩充。

losses:分类、检测、识别模型的损失函数。

metrics:

modeling:模型组建,包含:模型结构、backbone、heads、necks、transforms。

optimizer:学习率、学习策略、优化器、正则化。

postprocess:后处理。

utils:实用工具。

7、PPOCRLabel文件夹

标注工具文件夹,等用的时候再详细笔记。

8、StyleText文件夹

风格迁移文件夹用于生成样本数据,扩充训练样本。

9、Tools文件夹

包括训练、推理、评估的python脚本。可以通在根目录下写shell文件直接调用。

  • 19
    点赞
  • 113
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
PaddleOCR是一个基于PaddlePaddle深度学习框架的OCR(Optical Character Recognition,光学字符识别)工具包,可以识别各种文字类型的图片,包括中文、英文、数字等。本文将介绍如何使用PaddleOCR进行文字识别。 ## 安装PaddleOCR PaddleOCR的安装非常简单,只需要使用pip命令即可: ``` pip install paddleocr ``` ## 使用PaddleOCR 使用PaddleOCR进行文字识别非常简单,只需要导入包并调用相应的函数即可。以下是一个简单的示例代码: ``` python import paddleocr # 创建OCR实例 ocr = paddleocr.OCR() # 读取图片文件 img_path = 'test.jpg' img = paddleocr.load_image(img_path) # 进行文字识别 result = ocr.ocr(img) # 输出识别结果 for line in result: print(line) ``` 在上述代码中,我们首先导入了PaddleOCR模块。然后,我们创建了一个OCR实例,通过调用`paddleocr.OCR()`方法来实现。接着,我们读取了一张名为`test.jpg`的图片,并使用`paddleocr.load_image()`方法加载该图片。最后,我们调用OCR实例的`ocr()`方法进行文字识别,并将结果输出到控制台。 ## 配置PaddleOCR PaddleOCR还提供了一些配置选项,可以帮助我们优化识别效果。以下是一些常用的配置选项: - lang:要识别的语言类型。可选项包括`ch`, `en`, `fr`, `jp`, `korean`等。 - det:检测模型的名称。可选项包括`ch_ppocr_server_v2.0_det_infer`、`ch_ppocr_mobile_v2.0_det_infer`等。 - rec:识别模型的名称。可选项包括`ch_ppocr_server_v2.0_rec_infer`、`ch_ppocr_mobile_v2.0_rec_infer`等。 - cls:分类模型的名称。可选项包括`ch_ppocr_mobile_v2.0_cls_infer`等。 以下是一个配置PaddleOCR的示例代码: ``` python import paddleocr # 配置选项 lang = 'ch' det_model = 'ch_ppocr_server_v2.0_det_infer' rec_model = 'ch_ppocr_server_v2.0_rec_infer' # 创建OCR实例 ocr = paddleocr.OCR(lang=lang, det_model_dir=det_model, rec_model_dir=rec_model) # 读取图片文件 img_path = 'test.jpg' img = paddleocr.load_image(img_path) # 进行文字识别 result = ocr.ocr(img) # 输出识别结果 for line in result: print(line) ``` 在上述代码中,我们通过设置`lang`、`det_model`和`rec_model`等选项,来配置PaddleOCR的语言类型和模型。然后,我们创建了一个OCR实例,并将配置选项传递给构造函数。最后,我们读取图片、进行文字识别,并输出识别结果。 ## 总结 使用PaddleOCR进行文字识别非常简单,只需要导入包并调用相应的函数即可。此外,PaddleOCR还提供了一些配置选项,可以帮助我们优化识别效果。如果你需要进行文字识别,不妨尝试一下PaddleOCR吧!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

落花逐流水

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值