Tesseract.js将图像OCR转换带给浏览器

最新推荐文章于 2024-05-10 09:52:46 发布

cune1359

最新推荐文章于 2024-05-10 09:52:46 发布

阅读量1.5k

点赞数

文章标签： python java javascript js web ViewUI

OCR转换仍然不是完美的，但是在过去几年中有了很大的改进。领先的是目前以C ++开源的Tesseract 翻译引擎 。

尽管这是一个令人难以置信的库，但是它仅限于软件。值得庆幸的是，有人将Tesseract移植到JavaScript中，称为Tesseract.js 。它支持多达60种语言 ，虽然它虽然不完美，但是却做得很好。

安装和设置轻而易举，您可以在页面上定位任何图像元素并运行Tesseract.recognize（）函数。这可以拍摄任何类型的图像，并且会在浏览器中自动进行自动压缩和转换 。

您可能会变得更加复杂，但是美丽之处在于， 如何使用一行代码即可运行OCR 。

如果您想观看现场演示，请查看Tesseract.js登陆页面。这在浏览器中是可行的，您可以在其中拖放任何扫描的文本图像以获得自动OCR翻译 。

您也可以通过GitHub页面在本地下载此示例，也可以通过直接从CDN包含Tesseract.js脚本来构建自己的应用程序。

最简单的代码示例如下所示，其中myImage是对HTML图像元素的直接引用：

Tesseract.recognize(myImage).then(function(result){
    console.log(result)
});

无论哪种方式，该库对于在Web上使用OCR都非常有用。它远非完美，但对于想要动态页内OCR功能的Web开发人员来说，它也是最佳的资源 。

要了解更多信息，请访问Tesseract.js GitHub页面，您可以在此处查看实时演示并浏览在线文档。

tesseract ocr示例

翻译自: https://www.hongkiat.com/blog/tesseract-js/

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Tesseract.js将图像OCR转换带给浏览器

OCR转换仍然不是完美的，但是在过去几年中有了很大的改进。领先的是目前以C ++开源的Tesseract 翻译引擎。尽管这是一个令人难以置信的库，但是它仅限于软件。值得庆幸的是，有人将Tesseract移植到JavaScript中，称为Tesseract.js 。它支持多达60种语言，虽然它虽然不完美，但是却做得很好。安装和设置很容易，您可以在页面上定位任何图像元素并运行...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。