OCR模型训练

利用多个不同的模型进行训练,选择效率和准确率更高的模型。

一、PP-OCRv4-rec

这个模型是官方baseline中使用的,但是模型比较小,表现能力有限。

%cd /home/aistudio/PaddleOCR
# 开始训练识别模型
!python tools/train.py  -c  ./configs/rec/PP-OCRv4/ch_PP-OCRv4_rec-sixteentang.yml \
                        -o  Global.pretrained_model="./pretrained_models/ch_PP-OCRv4_rec_train" \
                            Global.pretrained_model="./pretrained_models/ch_PP-OCRv4_rec_train/student.pdparams" \
                            # Global.checkpoints="./output/rec_ppocr_v4/latest"

准确率不到0.1,训练效果不尽人意。

二、PP-OCRv4_rec_hgnet

使用多数据集需要指定多个标签文件

Train:
  dataset:
    name: MultiScaleDataSet
    ds_width: false
    data_dir: /home/aistudio/work/DataForCompetitor/
    ext_op_transform_idx: 1
    label_file_list:
    - /home/aistudio/work/DataForCompetitor/train_label.txt
    - /home/aistudio/work/DataForCompetitor/LabelTrain.txt
    ratio_list:
    - 1.0
    - 1.0

标签文件的第一列中训练集图像路径必须是基于配置文件中的data_dir的相对路径。如:

        如果使用融合数据集,需要保证融合的数据集的标签文件和图像文件夹与原比赛数据集的图像文件夹及标签文件是同一个目录下的。使用融合数据集在训练的初期acc会比只用比赛数据集的acc要高大概0.1左右。

%cd /home/aistudio/PaddleOCR

!python tools/train.py  -c  ./configs/rec/PP-OCRv4/ch_PP-OCRv4_rec_hgnet-sixteentang.yml \
                        -o  Train.sampler.first_bs=352 \
                            Train.loader.batch_size_per_card=352 \
                            Eval.loader.batch_size_per_card=340 \
                            Optimizer.lr.learning_rate=0.00034375 \
                            PostProcess.name="CTCLabelDecode" \
                            Global.pretrained_model="./pretrained_models/ch_PP-OCRv4_rec_server_train/best_accuracy.pdparams" \
                            # Global.checkpoints="./output/rec_ppocr_v4_hgnet/latest"

        原始模型训练的准确度大概在0.10675左右,相比上一个模型识别准确率有所提高,最终我们使用了该模型。

三、导出OCR模型

%cd ~/PaddleOCR
!python tools/export_model.py   -c  "./configs/rec/PP-OCRv4/ch_PP-OCRv4_rec_hgnet-sixteentang.yml" \
                                -o  Global.pretrained_model="./output/rec_ppocr_v4_hgnet/iter_epoch_10.pdparams" \
                                    Global.save_inference_dir="/home/aistudio/infer/"

四、提交submission

把推理模型放到submission文件夹中的model文件夹下,压缩文件包,从本地上传提交。

必须注意submission.zip的格式必须和baseline中给出的格式一样!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值