PaddlePaddle 开源产业级文档印章识别PaddleX-Pipeline “seal_recognition”模型模型训练篇、寻找模型不准确的原因 (二)

最新推荐文章于 2025-03-14 12:09:37 发布

李楷杰

最新推荐文章于 2025-03-14 12:09:37 发布

阅读量793

点赞数 7

文章标签： paddlepaddle 人工智能自然语言处理目标检测 ocr 印章识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Li_Zhongxin/article/details/143743658

版权

AI时代到来，各行各业都在追求细分领域垂直类深度学习模型，今天给大家介绍一个PaddlePaddle旗下，基于PaddleX Pipeline 来训练印章识别的模型“seal_recognition”。

关于如何在本地配置所需环境及快速完成推理，请看上篇：PaddlePaddle 开源产业级文档印章识别PaddleX-Pipeline “seal_recognition”模型-CSDN博客

言归正传，当我们使用PaddleX Pipeline在本地安装和推理后发现，在某些情况下效果不太理想，比如：

因为我们使用的PaddleX的Pipeline产线，不是单独的某个模型。所以在遇到推理效果不理想时，我们不能立马知道是Pipeline 中的哪个模型效果不理想。

在PaddleX-Pipeline “seal_recognition”模型中，一张图像进来，要经过三个步骤（模型）：

1.印章目标检测（从一张图像中寻找到印章目标）。

2.印章文字检测（从印章中检测出文字）。

3.印章文字识别（从印章中识别文字）。

通过这三个步骤我们就可以清晰的知道，我们的识别效果差在哪个环节了，如果在图像中寻找不到印章，那么就是第一个模型的问题。有文字没有被检测出来，就是第二个模型问题。有文字没有被正确识别，或者错别字，就是第三个模型的问题。

只有找到了问题所在，我们才能正确直面问题、解决问题。

后续会更新如果对每个环节的模型进行训练及微调。希望大家持续关注。

PaddleX官方文档：PaddleX/docs/pipeline_usage/tutorials/ocr_pipelines/seal_recognition.md at release/3.0-beta1 · PaddlePaddle/PaddleX · GitHub

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。