首先我先讲下为什么要基于官方提供的训练模型进行训练:
(1)基于基础算法模型库的训练模型,需要自己基于很多数据进行训练才能得到一个好的效果,如果数据量少了就会出现预测效果不好的情况。
(2)PaddleOCR提供的训练模型和预训练模型已经是基于一定的数据量训练出来的模型。训练模型
是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型,在真实应用场景中有着更好的表现,预训练模型
则是直接基于全量真实数据与合成数据训练得到,更适合用于在自己的数据集上finetune。
一、基于PaddleOCR提供的文本检测模型进行预测效果演示
1、下载文本检测模型
我下载的是ch_ppocr_server_v1.1.det
2、解压到./pretrain_models
sudo tar -xf ch_ppocr_server_v1.1_det_train.tar
3、测试预测效果
sudo python tools/infer_de