paddleocr训练自己的数据最简单方式软件一键训练

paddleocr训练一般需要训练自己的文本检测模型或者文本识别模型,对于刚入门编程小白或者对paddleocr还不太熟悉的同学们很难短时间上手,也不知道怎么去配置让自己的数据集训练起来。为了解决paddleocr训练难的问题,FIRC最近开发了2个软件,可以轻松完成自己模型训练任务,支持文本检测或者文本识别模型.为了方便维护,软件分为文本检测版本和文本识别版本。文本检测版本截图如下:

文本检测版本软件使用流程非常简单,只要你有数据集,也不用特意分割数据集。因为软件会自动分割数据集,如果自己想分割数据集也可以支持导入。那么你只需要在界面点点改改即可完成数据集配置参数自动配置,而你只需要粘贴到自己paddleocr的python环境即可开始训练。使用步骤如下:

(1)使用PPOCRLabel标注自己的数据集并且导出自己文本检测用的数据集。也可以自己编写脚本转换成paddleocr支持的数据集格式,paddleocr支持的文本检测数据集格式如下:

可以看出数据集格式为:

图片路径[TAB占位符]json格式数据集,json数据集格式具体看上图就知道了

 (2)打开文本检测版本的软件后,将数据集图片路径和数据集txt标签分别导入训练集目录和训练集标签文件,然后保持验证集目录和验证集标签文件为空就行了,这时候软件会自动分割数据集为9:1,如果大家不想按照这个比例,则可以设置训练比例为自己想要的即可。注意必须是0到1之间,不能设置为0或者1.如果您想使用自己的验证集,则可以导入证集目录和验证集标签文件,这是训练比例设置就会失效。软件自动按照你的验证集和训练集进行配置。

(3)为了方便训练软件默认设置batchsize为1,大家训练起来后通过nvidia-smi查看自己显存占用如果小了可以调节大点。为了方便调节,软件不需要反复配置数据集,只需要通过按钮获取训练命令便可以快速配置文件且生成新的训练命令。

注意:使用软件前需要自己安装好自己的paddleocr环境,目前软件是在paddleocr2.4版本上进行开发,后续会同步开发,所以大家安装环境要对应为paddleocr2.4环境即可。软件只是提供方便训练,并不具有测试和转换功能,如果大家对于训练的模型要测试需要使用官方提供相关命令测试即可。

软件优点如下:

(1)不需要人工写代码转换数据集,不需要写代码和手动配置就可以快速训练自己的数据集

(2)支持智能分割数据集,软件会自动打乱数据集,这样保证均匀分布数据集去分割数据集

(3)软件支持标注自动检查,我们只需要在工具-检查数据集格式即可检查数据集格式是不是有问题

(4)软件支持自动记忆界面配置参数,即使再次打开软件依然可以获取到现在训练命令

(5)软件支持快速切换文本检测框架。软件可以在简单切换框架后,点击获取命令即可快速训练,非常更换模型结构训练自己的模型

更多更详细的信息可以参考官方提供的视频教程:paddleocr快速训练助手文本检测版使用教程_哔哩哔哩_bilibili

 文本识别版本截图如下:

    文本识别版本软件使用流程非常简单,只要你有数据集,也不用特意分割数据集。因为软件会自动分割数据集,如果自己想分割数据集也可以支持导入。那么你只需要在界面点点改改即可完成数据集配置参数自动配置,而你只需要粘贴到自己paddleocr的python环境即可开始训练。使用步骤如下:

(1)使用PPOCRLabel标注自己的数据集并且导出自己文本识别用的数据集。也可以自己编写脚本转换成paddleocr支持的数据集格式,paddleocr支持的文本识别数据集格式如下:

可以看出数据集格式为:

图片路径[TAB占位符]字符集

 (2)打开文本识别版本的软件后,将数据集图片路径和数据集txt标签分别导入训练集目录和训练集标签文件,然后保持验证集目录和验证集标签文件为空就行了,这时候软件会自动分割数据集为9:1,如果大家不想按照这个比例,则可以设置训练比例为自己想要的即可。注意必须是0到1之间,不能设置为0或者1.如果您想使用自己的验证集,则可以导入证集目录和验证集标签文件,这是训练比例设置就会失效。软件自动按照你的验证集和训练集进行配置。

(3)为了方便训练软件默认设置batchsize为1,大家训练起来后通过nvidia-smi查看自己显存占用如果小了可以调节大点。为了方便调节,软件不需要反复配置数据集,只需要通过按钮获取训练命令便可以快速配置文件且生成新的训练命令。

注意:使用软件前需要自己安装好自己的paddleocr环境,目前软件是在paddleocr2.4版本上进行开发,后续会同步开发,所以大家安装环境要对应为paddleocr2.4环境即可。软件只是提供方便训练,并不具有测试和转换功能,如果大家对于训练的模型要测试需要使用官方提供相关命令测试即可。

软件优点如下:

(1)不需要人工写代码转换数据集,不需要写代码和手动配置就可以快速训练自己的数据集

(2)支持智能分割数据集,软件会自动打乱数据集,这样保证均匀分布数据集去分割数据集

(3)软件支持标注自动检查,我们只需要在工具-检查数据集格式即可检查数据集格式是不是有问题

(4)软件支持自动记忆界面配置参数,即使再次打开软件依然可以获取到现在训练命令

(5)软件支持快速切换文本检测框架。软件可以在简单切换框架后,点击获取命令即可快速训练,非常更换模型结构训练自己的模型

(6)软件支持字符集全自动生成或者手动导入,而且是否启用空格识别也是自动识别不需要手动在软件界面配置

(7)支持cpu或者GPU训练,只要你搭建好CPU环境选择cpu即可,如果搭建的是GPU环境选择自己对应的显卡即可。

更多更详细的信息可以参考官方提供的视频教程:paddleocr快速训练助手文本识别版使用教程_哔哩哔哩_bilibili

  • 1
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 8
    评论
要使用PaddleOCR训练自己的数据集,首先需要准备训练数据训练数据应包含两个主要部分:图像和对应的标注信息。图像是待识别的文本图像,标注信息是图像中文本的位置框和对应的文本内容。 接下来,需要将训练数据转换为PaddleOCR可接受的格式。可以使用LabelImg等工具对图像进行标注,并将标注信息保存为XML或JSON格式。然后使用PaddleOCR提供的脚本将标注信息转换为PaddleOCR所需的格式,如PaddleOCR提供的demo中的数据格式。 在数据准备好之后,需要配置PaddleOCR训练参数。可以通过修改PaddleOCR提供的训练配置文件来设置训练的参数,如网络结构、学习率等。 接下来,运行PaddleOCR训练脚本,开始训练自己的数据集。在训练过程中,PaddleOCR会使用标注信息进行模型的训练和优化。可以根据设定的训练轮数等参数来控制训练过程的长度。 训练完成后,可以使用训练好的模型对新的图像进行文本识别。可以使用PaddleOCR提供的预测脚本,将图像输入模型,得到文本识别结果。 需要注意的是,在整个训练过程中,可能需要对数据集进行多次的迭代和调优,才能得到较好的识别效果。可以根据实际情况进行反复训练和调整。 总之,使用PaddleOCR训练自己的数据集需要准备标注好的训练数据,配置训练参数,运行训练脚本,并反复迭代和调整,最终得到满意的文本识别模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FL1623863129

你的打赏是我写文章最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值