学习目标:
学习内容:
OCR项目
改论文代码
学习时间:
12.25-12.30
学习产出:
一、做OCR项目的任务
1、使用opencv对阴影图片进行预处理后的图片存在阴影处的文字会变白的问题,猜测是由于阴影处像素与字体像素太接近的原因,opencv无法很好的进行处理,于是想到使用深度学习对图片进行处理。找了几个CVPR和AAAI上的模型进行处理,但是目前还没有较大进展,模型效果都不是很理想。
2、对于图片预处理还存在一个印刷纸张存在油墨造成图片中的文字看不清楚的问题,目前还没有找到方法进行处理。
2、修改使用DDPM代替ViTGAN中GAN的代码
由于前面比较忙很久没改了,所以进度比较慢,目前还在修改代码。