简介
在文档电子化的过程中,常常需要从获取的图像文件中提取出需要的信息。这个过程中,最准确的方式是用机器思考的方式进行,典型的做法是识别二维码获取内容。如果您的文档满足这个条件,可以参考[二维条码识别](../Dev-Guide/Barcode-Reader.md)。实际应用中,一般获取的图像中包含的信息是以人类思考的方式展现的,即文字。这种情况下,要让机器读懂并提取信息,就要用到**光学字符识别技术**(英语:Optical Character Recognition,OCR)。本文中我们探讨一下如何快速的实现在浏览器中扫描并识别文字。
环境要求
1. 通过npm下载本文使用的核心控件
npm install dwt@14.0.3
然后在这个目录可以看到
2. 打开到以下目录
node_modules\dwt\samples
可以看到