PaddleOCR训练自己模型(1)----数据准备

本文详细介绍了如何下载PaddleOCR2.6RC版本,处理环境安装,使用PPOCRLabel进行数据集标注,以及生成训练所需的train_data文件。还提供了解决标注软件报错的方法和处理空行问题的代码。
摘要由CSDN通过智能技术生成

一、下载地址:

PaddleOCR开源代码(下载的是2.6RC版本的,可以根据自己需求下载)

具体环境安装就不详细介绍了, 挺简单的,也挺多教程的。

二、数据集准备及制作

(1)下载完代码及配置完环境之后,运行PPOCRLabel.py文件,打开标注软件(2.7版本的会运行报错,解决方案如下解决PPOCRLabel.py报错operands could not be broadcast together with shapes (213,488,4) (1,1,3)-CSDN博客

(2)运行成功后,点击文件,导入图片所在的路径,然后点击自动标注

(3)自动标注完之后,核对每一张的标签。核对完成之后点击确认,否则导出的时候不会显示

(4)点击左上角的文件,导出标记结果导出识别结果。两个文件都导出完之后,会多生成几个文件。

 

(5)在PaddleOCR下创建一个train_data文件夹,然后将标注好的整个文件夹复制到train_data里。

(6)打开PPOCRLabel/gen_ocr_train_val_test.py文件,把路径修改为自己的路径,然后运行gen_ocr_train_val_test.py

(7)运行结束之后会在train_data里面生成det和rec两个文件夹,分别对应定位和文字识别的数据

使用2.6版本代码生成的txt文件会有空行,训练时会报错估计是bug。如果有空行可以通过下面代码来修改,把det和rec两个文件夹下的txt文件都修改(代码路径自行修改)

import os
import json

# 1.读取txt文件, 把文件里的空行去除,并更新到原文件
txt_path = r"D:\Github_Code\PaddleOCR\train_data\rec\train.txt"

# 读取txt文件, 把文件里的空行去除,并更新到原文件
def read_txt(txt_path):
    with open(txt_path, 'r', encoding='utf-8') as f:
        lines = f.readlines()
    new_lines = []
    for line in lines:
        if line.strip() != '':
            new_lines.append(line)
    with open(txt_path, 'w', encoding='utf-8') as f:
        f.writelines(new_lines)
    return new_lines

lines = read_txt(txt_path)





  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具 RoboMaster智能数据集标注工具
要使用PaddleOCR训练自己的数据集,首先需要准备训练数据训练数据应包含两个主要部分:图像和对应的标注信息。图像是待识别的文本图像,标注信息是图像中文本的位置框和对应的文本内容。 接下来,需要将训练数据转换为PaddleOCR可接受的格式。可以使用LabelImg等工具对图像进行标注,并将标注信息保存为XML或JSON格式。然后使用PaddleOCR提供的脚本将标注信息转换为PaddleOCR所需的格式,如PaddleOCR提供的demo中的数据格式。 在数据准备好之后,需要配置PaddleOCR训练参数。可以通过修改PaddleOCR提供的训练配置文件来设置训练的参数,如网络结构、学习率等。 接下来,运行PaddleOCR训练脚本,开始训练自己的数据集。在训练过程中,PaddleOCR会使用标注信息进行模型训练和优化。可以根据设定的训练轮数等参数来控制训练过程的长度。 训练完成后,可以使用训练好的模型对新的图像进行文本识别。可以使用PaddleOCR提供的预测脚本,将图像输入模型,得到文本识别结果。 需要注意的是,在整个训练过程中,可能需要对数据集进行多次的迭代和调优,才能得到较好的识别效果。可以根据实际情况进行反复训练和调整。 总之,使用PaddleOCR训练自己的数据集需要准备标注好的训练数据,配置训练参数,运行训练脚本,并反复迭代和调整,最终得到满意的文本识别模型

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值