人工智能AI系列 - java WebUI - OCR 自定义模板识别(支持表格识别)

OCR 自定义模板识别(支持表格识别)

文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别,
交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。
OCR(文字识别)是目前常用的一种AI能力。
一般OCR的识别结果是一种按行识别的结构化输出,能够给出一行文字的检测框坐标及文字内容。
但是我们更想要的是带有字段定义的结构化输出,由于表单还活着卡证的多样性,全都预定义好是不现实的。
所以,设计了自定义模板的功能,能够让人设置参照锚点(通过锚点匹配定位,图片透视变换对齐),以及内容识别区
来得到key-value形式的结构化数据。

当前版本包含了下面功能:

  1. 模板自定义
  2. 基于模板识别(支持旋转、倾斜的图片)
  3. 自由文本识别(支持旋转、倾斜的图片)
  4. 表格文本识别(图片需是剪切好的单表格图片)
  5. 表格自动检测文本识别(支持表格文字混编,自动检测表格识别文字,支持多表格)
1. 自定义模板 - 参照锚点设置

Screenshot

2. 自定义模板 - 内容识别区设置

Screenshot

3. 基于模板文字识别

Screenshot

4. 通用文本识别

Screenshot

5. 表格文字识别

Screenshot

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值