使用Springboot + Tesseract OCR引擎实现图片文字自动识别
Tesseract是一款优秀的开源OCR软件,是由HP实验室开发,Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。目前由Google维护改进,已发展到5.0版本,从4.0版本起增加了基于LSTM神经网络的识别引擎。
原创
2024-02-01 23:27:40 ·
1227 阅读 ·
1 评论