LEADTOOLS使用教程:表单识别和处理流程概述

ECM(Enterprise Content Management)系统,尤其是文档图像应用程序的一个主要特点就是表单识别和处理。ECM系统在采集、管理、储存和传递文件过程中,表单识别和处理是优化整个工作流的一个关键因素。

表单识别是一个填写表单并自动确定表单类型的过程。表单识别也是一个从所填写的表单中自动提取关键信息的过程。

在大多数情况下,一个典型的工作流以创建需要被处理的实际表单为起点,以存储稍后需要检索的数据和生成报表为终点。

表单识别和处理流程如下:

Form Creation(表单创建): 该步骤创建实际表单,并将所有相关信息和字段添加到窗体。

Distribution(分配):表单被分配给用户填写,文档以电子形式或者纸面形式进行分配。

Input/Capture(输入和捕获):文件可以以多种方式进行捕获。一旦文档被捕获,文档就被发送到内容管理系统中进行处理。源文档捕获

  • 扫描/传真文件
  • 导入所填写的电子文档
  • 现有的电子文档

Image Cleanup(图像清理):为了最大限度地提高识别和处理结果,该文件必须尽可能干净。 LEADTOOLS提供了一套广泛的方法移除扫描或传真图像中的一些常见问题,去除点、线和孔。

Recognition(识别):图像清理后就可以进行识别。通过识别还可以确定图像类型。在识别过程中,可以采用多种识别技术,如条形码、OCR以及LEADTOOLS所提供的其他技术等。可以标注一些无法识别的表单并且以后还可以手动检查。

Processing(处理):一旦识别出了表单类型,我们就可以知道哪些信息需要被提取以及位于窗体上的位置。所有相关信息如条码数据、客户填充数据(姓名,地址,日期,签名,徽标等)均可被提取。OCR, ICR和 OMR等多种技术均被用户提取数据。一些无法识别的表单将被标注出来,并且以后还可以手动检查。

Quality Assurance(质量保证):在某些情况下,表单可能无法被识别或处理。这些情况包括:扫描\传真质量低、表单没有添加到master collection、单证不全、文件没有被填写好等等。质量保证机构将手工检查这些文件,并决定稳健是否应该识别和处理,或者需要重新创建。

Output(输出):此时,表单已经就绪,准备输出。输出阶段通常需要用到所提取的数据。可以对输出文档进行存储、归档、以电子邮件发送结果、生成报表和启动其他过程等。原始文件可以以最为有效的格式进行存储,如LEADTOOLS ABC,还可以一些TIFF、PDF和JPEG等标准格式存储。 LEADTOOLS目前支持140种不同格式。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
LEADTOOLS Imaging Pro SDK是一个支持150多种光栅图像格式(JPEG,GIF,TIFF...)的应用程序接口(API) 、C++类库、 ActiveX与VCL的工具箱;拥有超过2000种图像处理效果、图像变换及过滤、多种加载与观察选项、TWAIN扫描、打印、微型浏览器、Internet及数据库成像功能、压缩、屏幕捕获、绘图、颜色转换、Internet/intranet成像、图形转换、共用对话框等;同时也包括开发者所需要的集成绘图功能以及应用中的数字绘图功能。 0 特征综述 About Feature 声明:本产品中文介绍为慧都控件网版权所有,未经慧都公司书面许可,严禁拷贝、转载! 文件格式支持 采用工业标准和专有压缩技术,可同时支持150多种图像文件格式以及sub-格式的加载、保存和转换。另外,采用LEADTOOLS能添加更多的格式支持,例如采用LEADTOOLS PDF插件,即能实现对PDF文件的加载、保存和转换支持。 压缩支持 支持多种工业标准的压缩技术,包括JPEG、CCITT、LZW (使用于GIF及某些TIFF文件)、ZIPLIB (使用于PNG文件)、Huffman算法、RLE及紧缩位压缩算法(Packbits)。另外,采用LEADTOOLS JPEG2000 插件和 LEADTOOLS CMW 插件可添加JPEG2000 及先进的CMW压缩技术。 TWAIN扫描支持 TWAIN 驱动几乎包含在所有的扫描仪及其它图像采集设备中,同时随着最新的发展技术,TWAIN 也是性能良好与高可靠性驱动的最佳选择。当前LEADTOOLS 的光栅图像产品支持所有包括在TWAIN v1.9 规范中的功能。 屏幕捕获 具有强大的屏幕捕获功能,能从文件、菜单、窗口、不同形状的屏幕客户区域等捕获资源。屏幕捕获工具是极其有用的,特别是在文档编辑及需提供其它图像输入方式的时显得更为重要。 数据库支持 同时提供高端或低端的数据库支持,其中包括绑定VB数据控件功能、OLEDB 接口、ODBC 接口以及低端加载和保存图像到内存的功能。 Internet 支持 提供几种不同级别Internet支持,包括:可封装到CAB文件的对象、能在web服务器端构造的对象、从URL或存储器装载图像的功能、支持HTTP 和FTP的控件、解析并加载到web服务器端的文件控件,以及用来构造功能强大、通过TCP/IP发送远程过程调用的客户服务器应用程序控件。 图像优化 基于具体优化选项,LEADTOOLS 提供了某些优化图像文件格式以及通过保存图像时使用合适的每个像素所占用的位来减小图像文件大小的功能。 显示与显示效果 对图像如何被显示进行完全地控制,包括缩放、展开、图像显示的区域控制以及超过2000种的特效效果。LEADTOOLS 甚至包含了一个平铺窗口,这样你能方便地显示图像概要及选用适合最终用户的卷起、平铺方案。 打印支持 由于能使用与显示图像同样的代码来进行打印,所以打印图像与显示图像同样容易。你能控制图像打印的尺寸和位置;另外,能结合Windows GDI函数同LEADTOOLS打印一起使用,提供在同一页上打印文本和多个图像的灵活性。 图像处理 超过200种图象处理功能,分为四个基本类别:过滤、变换、色彩转换及绘图。在LEADTOOLS中的大多数图像处理功能支持不同着重区域,允许图像的某一部份被处理。通过添加更多用于数字绘图的功能,LEAD在LEADTOOLS Raster Imaging Pro中提供了包含大量用于数字绘图功能,包括笔刷、形状、纹理的创建与使用以及更多。 色彩转换 为确保你能把图像从一种格式转换到另一种格式,或是在任何其它显示设备上显示图象,LEADTOOLS 包含了强大的色彩转换功能。该色彩转换功能包括:支持8 种以上色彩平滑过渡算法、多种调色板选项以及把图像数据从任何支持的每个像素所占用的位转换到其他支持的每个像素所占用的位功能。支持的数值有1-8位色或灰度、16位色、24 位色和32 位色。如果你需要12或16位灰度或48与64位色支持。 图像公共对话框 LEADTOOLS 图像公共对话框通过扩展Windows公共对话框以提供具体的图像处理功能,节省了大量的繁琐编程时间,同时能给最终用户提供一个一致的外观和感觉。这个公共对话框针对图像处理、变换及特效提供专业的图像公共对话框功能。 数字绘图 数字绘图是任何想给应用程序增加数字绘图功能所必须的。使用 LEADTOOLS 的数字绘图特性,开发者可以创建一个完整的图像编辑或设计应用程序,也可简单地添加这些功能的一部分到现有的应用程序中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值