百度OCR文字识别及使用案例

百度OCR文字识别使用案例

案例环境
Windows10、Jdk1.8、IDEA2019.3.5旗舰版

一、账号注册及创建应用
1.访问地址:
https://ai.baidu.com/tech/ocr/general?track=cp:aipinzhuan|pf:pc|pp:AIpingtai|pu:2-2||kw:10005804
打开的页面,如图1.1所示
在这里插入图片描述
图1.1
2.点击如图1.2所示左下角“立即使用”,页面跳转到账号注册页;
在这里插入图片描述
图1.2

3.注册页面如图1.3所示,1表示已有账号,用百度智能云APP或百度APP扫码登录;2表示已有账号,用账号和密码登录;3表示没有账号,立即注册。
在这里插入图片描述
图1.3
4.本案例讲解第3点“立即注册”,进入注册页面,如图1.4所示,填写用户名、手机号,密码,获取验证码即可。
在这里插入图片描述
图1.4
5.注册账号后,页面跳到登录页面,如图1.3所示,登录即可;

6.登录成功,页面跳转到控制台管理中心,如图1.5所示,点击创建应用。
在这里插入图片描述
图1.5
7.应用创建界面如图1.6、1.7所示,1是应用名称,2是应用类型,3是接口选择,4是文字识别包名, 5是应用介绍。2和3根据需要选择即可。文字识别接口默认以勾选,不可改变。4选不需要,在5的地方简单介绍项目。
在这里插入图片描述
图1.6

填写好后,点击“立即创建”创建应用。
在这里插入图片描述
图1.7
8.应用创建成功,点击“查看应用详情”,图1.8所示;

图1.8
9.应用界面如图1.9所示,API Key和Secret Key是获取access_token的两个重要参数,要保密好,防止被恶意盗用。
在这里插入图片描述
图1.9

10.文字识别提供多种API识别接口,且各个接口都有免费使用额度。我们根据实际情况需要调用相应接口。本案例选第一个“通用文字识别”作为示例。如图1.10
在这里插入图片描述
图1.10

二、下载及安装OCR Java SDK
直接使用JAR包步骤如下:
1.在官方网站下载Java SDK压缩工具包。地址:https://ai.baidu.com/sdk
如图2.1所示,显示的第一个页面是语音识别的SDK,不是我们需要的。在左侧SDK资源列表中找到“文字识别”
在这里插入图片描述
图2.1
文字识别的Java SDK如图2.2所示:
在这里插入图片描述
图2.2
2.将下载的aip-java-sdk-version.zip解压后,复制到工程文件夹中,在工程中添加SDK工具包aip-java-sdk-version.jar和第三方依赖工具json-20160810.jar、
slf4j-api-1.7.25.jar、slf4j-simple-1.7.25.jar、gson-2.8.5.jar。其中,version为版本号,添加完成后,就可以在工程中使用OCR Java SDK。关于gson-2.8.5.jar包,百度官方未提供,这是谷歌的一个jar包。已放在工程文件夹aip-java-sdk-4.11.1中,也可以从以下链接下载:https://mvnrepository.com/artifact/com.google.code.gson/gson/2.8.5。

三、获取access_token
重要参数:API Key、Secret Key
程序见工程文件中的AuthService类,在Main程序中先运行AuthService,得到access_token。在拿到access_token后,注释掉Main中的AuthService,避免多次申请access_token。
IDEA输出如图3.1所示,access_token位于”result:{ }”中
在这里插入图片描述
图3.1
复制下来,整理好后,如图3.2所示
在这里插入图片描述
图3.2

四、上传图片,返回识别结果
重要参数:access_token、image
程序代码见工程文件中的GeneralBasic类。
重要提示:代码中所需工具类FileUtil,Base64Util,HttpUtil,GsonUtils在工程文件中的tooClass文件夹,也可以从以下链接下载:
https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3

在IDEA中程序运行结果如图4.1所示,识别结果如蓝色框中的“result:{ }”
在这里插入图片描述
图4.1
复制整理后的效果如图4.2所示
在这里插入图片描述
图4.2

测试用的图片:
在这里插入图片描述
支持一下,点个赞!!!

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 要在Java中实现调用百度OCR票据识别服务,可以按照以下步骤进行: 1. 首先,我们需要获取百度AI开放平台的相关API Key和Secret Key。可以在百度AI开放平台的官方网站上注册并创建一个应用,然后获取到这两个关键的身份验证参数。 2. 在Java中,可以使用百度AI开放平台提供的Java SDK来调用相关服务。首先,需要确保项目中已经引入了百度OCRJava SDK依赖。 3. 创建一个OCRClient对象,并使用之前获取到的API Key和Secret Key进行身份验证。 4. 为要识别的票据准备好图片数据。可以使用Java的File类来读取本地图片文件,也可以直接使用网络上的图片URL。将图片数据转换为字节数组。 5. 调用票据识别的方法,传入要识别的图片数据。可以使用票据识别的方法来识别票据中的各种字段信息,如发票代码、发票号码等。 6. 处理返回的结果。根据百度OCR API的返回结果,解析出需要的字段信息,并进行相应的业务处理。 7. 最后,记得释放资源和处理异常情况,确保程序的稳定性和安全性。 这样,我们就可以在Java中调用百度OCR票据识别服务了。记得在调用API之前,阅读相关文档和了解API的使用限制和注意事项,以确保调用的有效性。 ### 回答2: 在Java中调用百度OCR票据识别功能,可以通过以下几个步骤来实现。 首先,需要在百度云AI平台上创建一个OCR应用,并获取应用的API Key和Secret Key。这些凭证将用于后续的认证和授权。 然后,需要引入百度AIP Java SDK,可以通过maven等方式将它添加到项目的依赖中,以便能够在代码中使用百度OCR相关的接口。 接下来,在代码中构建AipOcr对象,将API Key和Secret Key以及OCR接口的请求地址设置进去。可以通过AipOcr的实例来调用百度OCR相关的接口。 调用百度OCR票据识别功能时,可以通过调用AipOcr对象的receiptRecognize方法来实现。将票据图片的二进制数据作为参数传递给该方法即可。 对于返回的结果,可以通过解析返回的JSON数据来获取识别结果。如票据的种类、识别的文字内容、发票代码、发票号码等信息。 最后,根据需要对返回的识别结果进行处理和展示,可以输出到控制台,保存到文件,或者在界面上显示出来。 总结起来,调用百度OCR票据识别功能需要先获取API Key和Secret Key,然后引入百度AIP Java SDK,构建AipOcr对象,并调用相关接口进行票据识别。最后根据识别结果进行后续处理。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值