AI时代到来,各行各业都在追求细分领域垂直类深度学习模型,今天给大家介绍一个PaddlePaddle旗下,基于PaddleX Pipeline 来训练印章识别的模型“seal_recognition”。
关于如何在本地配置所需环境及快速完成推理,请看上篇:PaddlePaddle 开源产业级文档印章识别PaddleX-Pipeline “seal_recognition”模型-CSDN博客
言归正传,当我们使用PaddleX Pipeline在本地安装和推理后发现,在某些情况下效果不太理想,比如:
因为我们使用的PaddleX的Pipeline产线,不是单独的某个模型。 所以在遇到推理效果不理想时,我们不能立马知道是Pipeline 中的哪个模型效果不理想。
在PaddleX-Pipeline “seal_recognition”模型中,一张图像进来,要经过三个步骤(模型):
1.印章目标检测(从一张图像中寻找到印章目标)。
2.印章文字检测(从印章中检测出文字)。
3.印章文字识别(从印章中识别文字)。
通过这三个步骤我们就可以清晰的知道,我们的识别效果差在哪个环节了,如果在图像中寻找不到印章,那么就是第一个模型的问题。有文字没有被检测出来,就是第二个模型问题。有文字没有被正确识别,或者错别字,就是第三个模型的问题。
只有找到了问题所在,我们才能正确直面问题、解决问题。
后续会更新如果对每个环节的模型进行训练及微调。希望大家持续关注。