扫描识别工具Dynamic Web TWAIN使用教程:OCR(上)

Dynamic Web TWAIN是一个专为Web应用程序设计的TWAIN扫描识别控件。你只需在TWAIN接口写几行代码,就可以用兼容TWAIN的扫描仪扫描文档或从数码相机/采集卡中获取图像。然后用户可以编辑图像并将图像保存为多种格式, 用户可保存图像到远程数据库或者SharePoint。这个TWAIN控件还支持上传和处理本地图像。

在Web应用程序中快速实现文本识别

介绍

在文档数字化的过程中,经常需要从所获取的图像中提取所需的信息。光学字符识别(OCR)是可以实现此需求的技术。在本文中,我们将探讨如何使用Dynamic Web TWAIN及其OCR加载项在浏览器中快速扫描和识别文本。

请注意:在本文我们只讨论基础的OCR引擎,我们将在客户端使用它。引擎也可以在服务器端使用。

环境

OCR模块本身不依赖于Node.js,本文中需要它只是因为使用其包管理器(npm)获取所需文件的速度更快。

步骤

步骤1 创建一个新目录,打开命令行工具(快捷键是Ctrl + Shift +右键单击)。通过npm下载本文中使用的核心控件

npm install dwt@14.2.0

然后,你可以在此目录中看到以下内容

目录1

步骤2 打开以下目录

node_modules\dwt\sample

在此你可以看到

目录2

步骤3 在本文中,我们将检查OCRADocument.html。双击它打开。如果相关控件尚不可用,请按照提示进行安装

安装提示

在正常情况下,可以在C:\Windows\SysWOW64\Dynamsoft\DynamsoftService目录中找到已安装的文件。这里的核心文件主要是:

  • DynamsoftService.exe
  • dwt_trial_14.1.0.0828.dll
  • DynamicOCR.dll
  • /DynamicOCR/

步骤4 安装完成后,刷新页面,单击Scan Documents(本地需要扫描仪)或Load Images or PDFs以扫描或加载带有英文文本的本地图像文件。然后单击OCR An Image with English。 然后,图像的识别结果将显示在右侧的结果框中

识别结果

后续将与大家分享如何实现上述功能,敬请期待~

                                                                【Dynamic Web TWAIN最新版免费下载>>>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值