
OCR研究学习总结1
OCR在招投标行业比较普遍且复杂,大部分都是扫描件,包括swf视频/pdf文档/png/doc等格式的文件,我们首先需要对这些文件进行分类处理,pdf/doc文档这种内容非图片的可以直接解析成文字,其他的都需要处理成相同格式的图片,并对图片进行预处理。图片中的文字、公式、表格、图片等复杂的文本结构是我们必须针对不同类型的扫描件做不同的预处理,以便于准确的进行文字定位。然后进行文字切割,对切割的图片进行特征工程:滤波、傅里叶变换、时域、频域特征、像素变化特征、像素变化规律、像素方差、均值、异常像素、直方图、像











