PaddleOCR检测模型训练深度解析

意义和目的:
因为官方模型或三方模型不能有效的达到项目检测目标,所以自己训练能实现需求的模型。

模型概述:
骨干网络
resnet 残差卷积神经网络
mobilenet 轻量卷积神经网络

技术路线:

数据集
a.骨干网络模型
b.PaddleOCR模型
ResNET
MobileNET V3
PP-OCRv3
PP-OCRv4

a:从骨干网络基础上训练模型(自己训练基座模型)
b:基于PP-OCR模型的微调(官方训练出的基座模型上微调)

区别:
a 能学习到自有数据集的基本特征;b 在开源数据集上训练,带有开源数据集的基本特征

优劣:
a 对自有数据集的针对性强,泛化弱;b 公开数据泛化强,针对弱。

现象:
a 从0起步训练,对自有数据的效果明显,但提高训练精度指标难。
b 在一定精度上起步,精度指标天生高,对自有数据实际效果不明显。

总之:
b 指标数据漂亮 hmean 0.9以上,但你很难纠正模型固有的思维(除非拿近似级别的数据量去纠正),效果难达到预期。
a hmean 0.6左右就有明显效果,但进一步提升需要寻找更佳超参组合,或加数据量。

实际训练和测试

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值