PaddleOCR 训练自己的模型，评估acc为0，且无best_accuracy

最新推荐文章于 2024-07-16 11:15:42 发布

是小侯鸭

最新推荐文章于 2024-07-16 11:15:42 发布

阅读量631

点赞数 16

文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60584465/article/details/139939248

版权

最近在训练自己的PaddleOCR模型时，尝试多次每次评估acc始终为零，也一直没有出现最佳参数结果，但训练acc早达到了0.98，这是为什么呢？

为了找出具体原因，于是进入train.py文件中debug查找原因，PaddleOCR在训练模型时，按照官方的指导教程，一般是在终端输入一下命令行的方式配置运行进行训练，如果想通过tools\train.py在右键运行或进入debug模式，就需要修改代码，具体参考PaddleOCR 如何修改代码进入手动调试模式-CSDN博客。

经排查发现是数据集量与配置文件中设置的不合适所导致，为了保证正常出现best_accuracy，在修改configs配置文件时，其中主要有两大注意点：

保证eval_batch_step(迭代次数要在总迭代次数内)，以configs\rec\PP-OCRv3中的ch_PP-OCRv3_rec_distillation.yml文件为例

eval_batch_step设置位置，如上图所示标记处，官方的具体解释如下图

全局的总迭代次数global_step在训练的终端中有打印出来，如下图所示，因此对照此值，即小于此值模型训练才会进入eval评估（本图中总迭代次数为1500，而评估间隔为2000，所以未评估）。

综上：如果没有根据总迭代次数，设置合理的评估区间，就不会出现best_accuracy，同时为确保best_accuracy值更准确，评估的次数要均匀合适。

train与eval中的数据集加载器loader中的batch_size_per_card大小需数据集大小而定，要确保其迭代次数大于等于1，如下图，具体迭代次数在训练信息目录最后两行。

而其设置在configs配置文件中如下图所示位置，迭代次数等于train或eval中的图片数除batch大小，其中除不尽的余数也算计数1轮，所以我们要根据自己数据集大小合理设置其大小。

关注

16
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
PaddleOCR 训练自己的模型，评估acc为0，且无best_accuracy

为了找出具体原因，于是进入train.py文件中debug查找原因，PaddleOCR在训练模型时，按照官方的指导教程，一般是在终端输入一下命令行的方式配置运行进行训练，如果想通过tools\train.py在右键运行或进入debug模式，就需要修改代码，具体参考。全局的总迭代次数global_step在训练的终端中有打印出来，如下图所示，因此对照此值，即小于此值模型训练才会进入eval评估（本图中总迭代次数为1500，而评估间隔为2000，所以未评估）。
复制链接

扫一扫

是小侯鸭 CSDN认证博客专家 CSDN认证企业博客

码龄3年

2: 原创

117万+: 周排名

17万+: 总排名

855: 访问

: 等级

41: 积分

12: 粉丝

17: 获赞

1: 评论

5: 收藏

私信

关注

热门文章

最新评论

PaddleOCR 训练自己的模型，评估acc为0，且无best_accuracy
倾城丿灬冷心: 为啥评估结果acc是0.0呢，上面epoch也到90多了。中间也有阶段性生成best_accuracy，但是acc也都是0.0
PaddleOCR 如何修改代码进入手动调试模式
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

PaddleOCR 如何修改代码进入手动调试模式

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。