无法将“npm”项识别为 cmdlet、_扫描识别工具Dynamic Web TWAIN使用教程:OCR(上)...

Dynamic Web TWAIN是一个专为Web应用程序设计的TWAIN扫描识别控件。你只需在TWAIN接口写几行代码,就可以用兼容TWAIN的扫描仪扫描文档或从数码相机/采集卡中获取图像。然后用户可以编辑图像并将图像保存为多种格式, 用户可保存图像到远程数据库或者SharePoint。这个TWAIN控件还支持上传和处理本地图像。

在Web应用程序中快速实现文本识别

介绍

在文档数字化的过程中,经常需要从所获取的图像中提取所需的信息。光学字符识别(OCR)是可以实现此需求的技术。在本文中,我们将探讨如何使用Dynamic Web TWAIN及其OCR加载项在浏览器中快速扫描和识别文本。

请注意:在本文我们只讨论基础的OCR引擎,我们将在客户端使用它。引擎也可以在服务器端使用。

环境

OCR模块本身不依赖于Node.js,本文中需要它只是因为使用其包管理器(npm)获取所需文件的速度更快。

步骤

步骤1 创建一个新目录,打开命令行工具(快捷键是Ctrl + Shift +右键单击)。通过npm下载本文中使用的核心控件

npm install dwt@14.2.0

然后,你可以在此目录中看到以下内容

f3874e75f00bc06e4174696fd691b2c5.png

步骤2 打开以下目录

node_modulesdwtsample

在此你可以看到

600e53e1989a81d84c360f4b968cbf75.png

步骤3 在本文中,我们将检查OCRADocument.html。双击它打开。如果相关控件尚不可用,请按照提示进行安装

3d6939ca7269739277413bbc75ce70c2.png

在正常情况下,可以在C:WindowsSysWOW64DynamsoftDynamsoftService目录中找到已安装的文件。这里的核心文件主要是:

  • DynamsoftService.exe
  • dwt_trial_14.1.0.0828.dll
  • DynamicOCR.dll
  • /DynamicOCR/

步骤4 安装完成后,刷新页面,单击Scan Documents(本地需要扫描仪)或Load Images or PDFs以扫描或加载带有英文文本的本地图像文件。然后单击OCR An Image with English。 然后,图像的识别结果将显示在右侧的结果框中

a2152b19c6cbdadabac8a27ec6a3b476.png

后续将与大家分享如何实现上述功能,敬请期待~

点击“了解更多”下载产品最新版

↓↓↓

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值