OCR转换仍然不是完美的,但是在过去几年中有了很大的改进。 领先的是目前以C ++开源的Tesseract 翻译引擎 。
尽管这是一个令人难以置信的库,但是它仅限于软件。 值得庆幸的是,有人将Tesseract移植到JavaScript中,称为Tesseract.js 。 它支持多达60种语言 ,虽然它虽然不完美,但是却做得很好。
安装和设置轻而易举,您可以在页面上定位任何图像元素并运行Tesseract.recognize()函数。 这可以拍摄任何类型的图像,并且会在浏览器中自动进行自动压缩和转换 。
您可能会变得更加复杂,但是美丽之处在于, 如何使用一行代码即可运行OCR 。
如果您想观看现场演示,请查看Tesseract.js登陆页面 。 这在浏览器中是可行的,您可以在其中拖放任何扫描的文本图像以获得自动OCR翻译 。
您也可以通过GitHub页面在本地下载此示例,也可以通过直接从CDN包含Tesseract.js脚本来构建自己的应用程序。
最简单的代码示例如下所示,其中myImage是对HTML图像元素的直接引用:
Tesseract.recognize(myImage).then(function(result){
console.log(result)
});
无论哪种方式,该库对于在Web上使用OCR都非常有用。 它远非完美,但对于想要动态页内OCR功能的Web开发人员来说,它也是最佳的资源 。
要了解更多信息,请访问Tesseract.js GitHub页面 ,您可以在此处查看实时演示并浏览在线文档。