Java 实现 图片OCR文字识别

Java 实现图片OCR文字识别功能

前言:

由于网上很多算法, 以及语言库无法做到精准识别, 所以综合条件下 使用了一款 space OCR API 的产品进行使用, 每个月有25000条的 使用额度, 日常使用或开发绰绰有余

网址链接


一. 注册 API 秘钥
1. 进入网址点击下面的注册链接输入自己的邮箱以及开发用途就会收到一个秘钥
image-20210927110736558
2. 注册好的API如下
image-20210927111035189
二. API解析
1. 上传方式选择

通过阅读API 文档我们可以得知, 发送图片解析的方式有三种:

  1. ) URL 上传, 前提是需要将图片放到公网可以访问到的位置
  2. ) File 上传, 通过Post 请求将图片放到from-data中发送
  3. ) base64编码上传 [推荐~]
2. 识别引擎选择

OCR 引擎 1 的特点:

  • - 支持更多语言(包括中文、日文和韩文等亚洲语言)
  • - 快点
  • - 支持更大的图像
  • - 多页 TIFF 扫描支持
  • - 参数:OCREngine=1

OCR 引擎 2 的特点:

3. 传参选择

在请求过程中只有两个参数是必填的, 分别是 apikey和 三种上传方式的一种

  1. ) language 在识别中文时可以选择 chs(简体), cht(繁体) 两种, 不识别中文可以选择引擎二 并且不用填写该参数
  2. ) filetype 填写该参数可以有效的增加识别精度
  3. ) scale 如果设置为 true,api 会进行一些内部升级。这可以显着改善 OCR 结果,尤其是对于低分辨率 PDF 扫描。 API 默认使用 scale=false
4. 请求参数解析
apikey API 密钥
urlfilebase64Image url:远程图像文件的 URL(确保它具有正确的内容类型file:具有文件名的多部分编码图像文件 base64Image:图像或 PDF 作为Base64 编码字符串 您可以使用三种方法上传输入图像或 PDF。对于大于 10 MB 的文件,我们建议使用 URL 方法以提高上传速度。
language [可选] 阿拉伯语=ara 保加利亚语=bul 中文(简体)=chs 中文(繁体)=cht 克罗地亚语=hrv 捷克语=cze 丹麦语=dan 荷兰语=dut 英语=eng 芬兰语=fin 法语=fre 德语=ger 希腊语=gre 匈牙利语=hun 韩语=kor 意大利语=ita 日语=jpn 波兰语=pol 葡萄牙语=por 俄语=rus 斯洛文尼亚语=slv 西班牙语=spa 瑞典语=swe 土耳其语 = tur 用于 OCR 的语言。如果未指定语言,eng则默认使用英语。 重要提示:语言代码总是3-letters(不是 2)。所以它是“eng”而不是“en”。 Engine2具有自动西文检测功能,因此该值将被忽略。
isOverlayRequired [可选] 布尔值 默认值 =False 如果为 true,则返回每个单词的边界框坐标。如果为 false,则 OCR 处理的文本仅作为文本块返回(这会使 JSON 响应变小)。例如,覆盖数据可用于在图像上显示文本
filetype [可选] 字符串值:PDF、GIF、PNG、JPG、TIF、BMP 覆盖基于content-type的自动文件类型检测。支持的图像文件格式有 png、jpg (jpeg)、gif、tif (tiff) 和 bmp。对于文档 ocr,api 支持 Adobe PDF 格式。支持多页 TIFF 文件。
d
  • 5
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

减白

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值