本次学习已经接近尾声,在第二次学习跑通baseline之后,就想着如何对baseline进行改进来提高分数,由于并没有深度学习开发的经验,上分之路感觉很难。
数据集中大概有两类分别是书本和小票,书本的识别是很简单的,但是对于小票的识别准确度很低。如何对小票进行数据增强很重要,也是提分的关键。
对于小票的方向,建议多旋转几个方向测试(TTS),用霍夫变换、透视变换摆正。而字体模糊可以通过进行锐化和对比度增强类处理。
最近由于沉迷与讯飞的比赛,这次的任务也没有很认真的去学习。等讯飞的比赛过去之后,再好好研究ocr,通过这次学习,学到paddleOCR的使用,感觉还是很有收获的,可以用paddleOCR结合其他的开发一点小项目来做。