近期,由于业务涉及到了一个发票自动识别入库的场景,于是查阅了一些资料,调用百度OCR高精度文字识别API,做了一个小测试。
1、注册一个百度智能云账号,拿到:client_id、client_secret,API Key就是:client_id,| Secret Key 就是 client_secret:
2、注册好了过后记得领取免费测试额度,否则会报错:
{‘error_code‘: 18, ‘error_msg‘: ‘Open api qps request limit reached‘}
2.1 领取完后,大约要等十来分钟才能生效,官方给的时间是:30分钟,领取地址:
3、拿到access_token,怎么拿?(拿postman做个示范)
3.1 请求URL:https://aip.baidubce.com/oauth/2.0/token
3.2 请求参数3个:grant_type(默认:client_credentials)、client_id、client_secret
3.3 请求方式:POST
3.4 复制access_token的value,下面的请求都要带上才行
4、测试以高精度的方式读取一个JPG图片格式的发票:
4.1 请求方式及地址:POST https://aip.baidubce.com/rest/2.0/ocr/v1/vat_invoice
4.2 请求参数:access_token
4.3 Headers:Content-Type: application/x-www-form-urlencoded
4.4 Body 选择 x-www-form-urlencoded,参数: image: 发票图片base64编码,记得去掉最前面这一段编码头信息:data:image/jpeg;base64,
【图片在线转换base64编码-在线base64编码转换成图片工具:http://www.jsons.cn/img2base64
】
示例: