PaddleOCR识别模型训练及问题解决

1、下载PaddleOCR release2.3

2、整理数据集

标签文本中的路径和标签值中间是一个tab

读取标签文件的时候,是把标签文件中的路径和上面数据集的路径合在一起,然后指向图片。

3、训练模型和配置文件config相对应,

比如说用的模型是ch_PP-OCRv2_rec,那么对应的配置文件也是ch_PP-OCRv2_rec.yml

4、训练及测试的代码

python tools/train.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml


python tools/infer_rec.py -c configs/rec/ch_PP-OCRv2/ch_PP-OCRv2_rec.yml

评估及生成export模型,以及详细参数的测试

python tools/eval.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml -o Global.checkpoints="./output/rec/202205121/best_accuracy"

python tools/export_model.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml -o Global.checkpoints="./output/rec/202205121/best_accuracy"  Global.save_inference_dir="./output/rec/202205121/export_model"

python tools/infer_rec.py -c configs/rec/20220511_ch_PP-OCRv2_rec.yml -o Global.checkpoints="./output/rec/202205160436/best_accuracy" Global.load_static_weights=false Global.infer_img="./train_data/test_20220429/"

5、测试的时候出现一个问题

 准确率很高,但是每个图片的识别结果都比原来大111

反复试验了几次,觉得训练过程应该没有问题,应该是哪个细节没整对,导致出现了这个偏差,

然后就去看字典,下面是我的字典

 

然后就看了一下icar15的字典

 发现没有指向字符0,而是把字符1当成了字符0,把字符2当成了字符1,依次往下错了一位。

带BOM的UTF-8,        UTF-8

Windows(CRLF),        Unix(LF)

然后就搜了一下Windows(CRLF)和Unix(LF)的区别

 根据以上线索,我重建了一个字典,然后用NotePad++把在Windows系统下建的txt文件格式改为Unix(LF)。编辑——》文档格式转换——》转为Unix(LF)

重新训练,结果正常

 

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值