PaddlePaddle飞桨OCR文本检测——识别模型训练（三）

最新推荐文章于 2024-05-25 09:12:51 发布

非常道

最新推荐文章于 2024-05-25 09:12:51 发布

阅读量6.1k

点赞数 3

分类专栏：人工智障 Python 文章标签：深度学习机器学习 python 计算机视觉

本文链接：https://blog.csdn.net/weixin_42845306/article/details/112726615

版权

Python 同时被 2 个专栏收录

16 篇文章 1 订阅

订阅专栏

人工智障

11 篇文章 17 订阅

订阅专栏

上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152
飞桨的OCR模型分为检测、识别和分类，今天讨论识别。
ORC的识别，就是给定一张剪辑好的图片，这个图片只有一串纯文本，计算机将图片里的内容识别出来。
要识别的图片：
在这里插入图片描述
OCR的识别和目标识别差不多，都是把猫的图片识别成猫，狗的图片识别成狗

数据集准备

进入正题
自定义图片标注的方法上一篇讲过，产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签rec_gt.txt，这两个就是识别的数据集和标签。

这回用一下别人现成的数据集：icdar2015
可以在官网上注册下载，也可以在我的网盘下载：
链接：https://pan.baidu.com/s/1dib-9dgjLssCu9dlwuYjig
提取码：gy57

注意这个数据集的标签格式与飞桨的读取格式不兼容，需要转换，参考
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md
云盘分享的已经包含转换后的标签。

数据集安置

在PaddleOCR-dygraph根目录下建立一个文件夹"train_data"，再新建一个文件夹"ic2015_data"作为数据集存放的位置，在ic2015_data里放入训练集和测试集的标签和对应的两个文件夹的图片（只放图片）。
在这里插入图片描述

预训练模型安置

可以从网上下载预训练模型，比如https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/rec_mv3_none_bilstm_ctc_v2.0_train.tar

将解压后的模型文件夹放在PaddleOCR-dygraph下新建的pretrain_models文件夹中，操作同上篇文章。

调参

在这里插入图片描述
找到rec_icdar15_train.yml，这是识别模型的参数训练设置，记事本打开。
里面的参数看着改，主要是图片文件夹和标签文件路径：
data_dir: ./train_data/ic2015_data
label_file_list: ["./train_data/ic2015_data/rec_gt_train.txt"]
如果有预训练模型，还要改pretrained_model路径
注意测试集和训练集的路径都要调整。

训练开始

在PaddleOCR-dygraph根目录打开cmd，输入以下命令即可测试

python -m paddle.distributed.launch tools/train.py -c configs/rec/rec_icdar15_train.yml

训练进行中：
在这里插入图片描述识别模型的效果可以看这篇文章：https://blog.csdn.net/weixin_42845306/article/details/113832699

一切都可以从手册学到https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

非常道

关注

3
点赞
踩
38

收藏

觉得还不错? 一键收藏
13
评论
PaddlePaddle飞桨OCR文本检测——识别模型训练（三）

上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152飞桨的OCR模型分为检测、识别和分类，今天讨论识别。ORC的识别，就是给定一张剪辑好的图片，这个图片只有一串纯文本，计算机将图片里的内容识别出来。要识别的图片：OCR的识别和目标识别差不多，都是把猫的图片识别成猫，狗的图片识别成狗数据集准备进入正题自定义图片标注的方法上一篇讲过，产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签r
复制链接

扫一扫