使用Tesseract-OCR进行字符识别,输入的图片质量对识别的结果有着至关重要的影响。以下是Tesseract官网上提到的提高图片质量的方法
https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality
大致方法有:
1.二值化
2.去除噪声
3.旋转,字体摆正
4.去除纸张边界
所有这些都是考验你图像处理基本功底是否扎实,而且是否能根据实际情况灵活应用。
使用Tesseract-OCR进行字符识别,输入的图片质量对识别的结果有着至关重要的影响。以下是Tesseract官网上提到的提高图片质量的方法
https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality
大致方法有:
1.二值化
2.去除噪声
3.旋转,字体摆正
4.去除纸张边界
所有这些都是考验你图像处理基本功底是否扎实,而且是否能根据实际情况灵活应用。