PaddleOCR文字识别模型训练

最新推荐文章于 2024-07-16 10:34:00 发布

BurningSilence

最新推荐文章于 2024-07-16 10:34:00 发布

阅读量8.2k

点赞数 7

分类专栏： PaddleOCR Python 文章标签： paddlepaddle ocr

本文链接：https://blog.csdn.net/BurningSilence/article/details/110468658

版权

本文详细介绍了如何使用PaddleOCR2.0.0版本训练中文场景文字识别模型，包括数据准备、字典创建、配置文件修改以及启动训练和预测的过程。

摘要由CSDN通过智能技术生成

本文主要介绍PaddleOCR2.0.0版本中文字识别模型的训练、评估及测试。

数据准备

中文场景文字识别技术创新大赛数据集

数据集共212023张文字图片。数据集地址

训练集

将训练图片放入同一个文件夹（train_images），并用一个txt文件（rec_gt_train.txt）记录图片路径和标签。

注意： 默认请将图片路径和图片标签用 \t 分割，如用其他方式分割将造成训练报错

" 图像文件名                 图像标注信息 "

img_001.jpg   简单可依赖
img_002.jpg   用科技让复杂的世界更简单

训练集txt生成代码如下代码：

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Auther: Andy
date: 11/25/20 1:36 PM

desc:
"""
train_list_path = "/data11/shaozhl/datasets/OCR/baidu_rec/train.list"
label_path = "/data11/shaozhl/datasets/OCR/baidu_rec/train_data/rec_data/rec_gt_train.txt"
with open(train_list_path, 'r') as fr:
    with open(label_path, 'w', encoding="utf-8") as fw:
        lines = fr.readlines()
        for line in lines:
            line = line.split("\t")
            fw.writelines(line[-2] + "\t" + line[-1])

最终训练集应有如下文件结构：

|-train_data
    |-rec_data
        |- rec_gt_train.txt
        |- train
            |- img_001.png
            |- img_002.jpg
            |- img_003.jpg
            | ...

测试集同理，

字典

因为是所用的数据集已经有标注（标注列表为train.list），所以只要将标注的数据转化为字典即可。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Auther: Andy
date: 11/25/20 11:09 AM

desc: 将中文场景文字识别技术创新大赛数据集label转化为PaddleOCR文字识别label
"""

train_list_path = "/data11/shaozhl/datasets/OCR/baidu_rec/train.list"
dict_path = "../ppocr/utils/baidu_rec_dict.txt"
texts = ""
with open(train_list_path, 'r') as f:
    lines = f.readlines()
    for line in lines:
        line = line.split("\t")
        texts += line[-1].replace("\n", "")

texts = set(texts)
with open(dict_path, 'w') as f:
    for text in texts:
        f.writelines(text+"\n")

在 configs/rec/rec_baidu_train.yml 中添加 character_dict_path 字段, 指向您的字典路径。并将 character_type 设置为 ch，因为该数据集label有的比较长，所以也要设置下max_text_length

character_dict_path: ./ppocr/utils/baidu_rec_dict.txt
character_type: ch
max_text_length: 100

rec_baidu_train.yml可参照rec_icdar15_train.yml重写。
下面是我自己的yml，仅供参考。rec_baidu_train.yml如下

Global:
  algorithm: CRNN
  use_gpu: true
  epoch_num:

最低0.47元/天解锁文章

BurningSilence

关注

7
点赞
踩
57

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录