上分思路
- 调整模型超参数并重新finetune
- 改进检测流程
- 尝试在其它模型基础上finetune
- 添加图片预处理
- 搭建更优的模型结构并从零训练
分析图片数据
-
部分图片如小票等拍摄时有偏转和透视角度
解决思路:
考虑多旋转几个方向测试
用霍夫变换、透视变换摆正 -
部分像广告类图片存在各种样式的艺术字体
解决思路:
切出来finetun recognizer
从图像检索任务借鉴思路 -
字迹模糊的样本
解决思路:
锐化和对比度增强类处理
训练时加随机模糊提高鲁棒性 -
广告类存在弯曲排版的文本
解决思路:
有针对性地数据增广增加样本量
尝试用TPS变换将边缘曲率归零
图像增加的一些方法
- 锐化
- 对比度
- 直方图均衡化
- 逐通道标准化
- 高反差保留
- 透视变换