大家好我是厂妹
一个拖了很久的OCR项目,一直没做,因为我看网上就是用tesseract的训练,寻思也没有多复杂多困难,结果真开始做,真是王八离家出走——憋不住了
这个沙雕tesseract,光是安装和使用就让人头大,更何况那个数据集处理,我一度真想:
结果,处理完结果不能用!!!!因为这个对数据集要求很精准,我辣么多张图片一个个自己改动,不是要我死
……换了几种方法,easyocr和LENET,参考了卓老师的程序,但定位部分我觉得他的思路太复杂了,写起来太麻烦,换了个思路
效果差强人意吧,一点一点补上博客
1、数码管图像处理
因为做的第一版是用HSV加掩膜,发现只能实用部分图片,不能够在通用数码管图片中使用。项目要求是大部分数码管拍照都读数。所以换了个思路,通过增加对比度在黑白图片上。
1.1 数据集
1.2 图像缩放
1.3 图像对比度加强
1.4 自适应阈值二值化+中值滤波
自适应阈值二值化
中值滤波后