PaddlePaddle飞桨OCR文本检测——识别模型训练(三)

上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152
飞桨的OCR模型分为检测、识别和分类,今天讨论识别。
ORC的识别,就是给定一张剪辑好的图片,这个图片只有一串纯文本,计算机将图片里的内容识别出来。
要识别的图片:
在这里插入图片描述
OCR的识别和目标识别差不多,都是把猫的图片识别成猫,狗的图片识别成狗
在这里插入图片描述

数据集准备

进入正题
自定义图片标注的方法上一篇讲过,产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签rec_gt.txt,这两个就是识别的数据集和标签。

这回用一下别人现成的数据集:icdar2015
可以在官网上注册下载,也可以在我的网盘下载:
链接:https://pan.baidu.com/s/1dib-9dgjLssCu9dlwuYjig
提取码:gy57

注意这个数据集的标签格式与飞桨的读取格式不兼容,需要转换,参考
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md
云盘分享的已经包含转换后的标签。

数据集安置

在PaddleOCR-dygraph根目录下建立一个文件夹"train_data",再新建一个文件夹"ic2015_data"作为数据集存放的位置,在ic2015_data里放入训练集和测试集的标签和对应的两个文件夹的图片(只放图片)。
在这里插入图片描述

预训练模型安置

可以从网上下载预训练模型,比如https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/rec_mv3_none_bilstm_ctc_v2.0_train.tar

将解压后的模型文件夹放在PaddleOCR-dygraph下新建的pretrain_models文件夹中,操作同上篇文章。

调参

在这里插入图片描述
找到rec_icdar15_train.yml,这是识别模型的参数训练设置,记事本打开。
里面的参数看着改,主要是图片文件夹和标签文件路径:
data_dir: ./train_data/ic2015_data
label_file_list: ["./train_data/ic2015_data/rec_gt_train.txt"]
如果有预训练模型,还要改pretrained_model路径
注意测试集和训练集的路径都要调整。

训练开始

在PaddleOCR-dygraph根目录打开cmd,输入以下命令即可测试

python -m paddle.distributed.launch tools/train.py -c configs/rec/rec_icdar15_train.yml

训练进行中:
在这里插入图片描述识别模型的效果可以看这篇文章:https://blog.csdn.net/weixin_42845306/article/details/113832699

一切都可以从手册学到https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

  • 3
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 13
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值