oc安装 uipath_UiPath如何调用百度OCR

本文介绍了如何在UiPath中使用百度OCR服务进行文字识别。首先在百度智能云平台注册并创建应用获取API Key和Secret Key,然后在UiPath Studio中通过一系列活动(如Take Screenshot、Save Image、Python Scope等)调用Python脚本进行图像识别,最后通过Log Message展示识别结果。
摘要由CSDN通过智能技术生成
  1. 百度OCR的介绍

百度OCR提供了多种场景下精准图像文字识别技术服务, 精准识别超99%, 并且可以免费试用. 详情大家可以去百度智能云官网了解, 地址是https://cloud.baidu.com/product/ocr_others/?_=1575858782543

二、百度OCR在UiPath中的使用

  1. 在使用百度OCR之前, 我们需要先在百度注册一个账号, 然后在此地址登录https://login.bce.baidu.com/?account
  2. 登录后, 点击左侧产品服务—人工智能—文字识别, 进入文字识别的控制台, 在此处新建一个应用, 根据提示, 填写应用的相关信息, 之后点击”立即创建”

8e31731f02057c34920477a212e9801a.png

dfa8b4fef2ddb0b27802da0ce0af35df.png

2a878b4fed61f424529ca62d5d29c02d.png
  1. 创建完成后, 我们可以在应用列表看到刚才创建的应用, 可以看到相应的API Key, Secret Key. 此处可以先记录API Key和Secret Key, 稍后我们将会用到

36aa5ea68051b853c9818c740d6f8d12.png
  1. 打开UiPath Studio设计器,在设计库中新建一个Sequence,为序列命名及设置Sequence存放的路径,然后在Activities中搜索Take screenshot,并将其拖至设计区,点击Indicate on screen, 之后点击需要识别的文字或数字验证码图片. 本案例使用的是一个数字验证码7364, 在Screenshot 属性中, 使用快捷键Ctrl + k自定义Image类型的变量img_code

2ff9205c832a095ca9f28aad4b79baba.png

2d130850ae26e180a0563f4028f9e670.png

f64ac0907fd4d9647a055bb45122db97.png

ea1a788da8c3a13e382bd1b383746d8a.png
  1. 在Activities中搜索Save Image,并将其拖至设计区, 在Image属性中, 输入步骤4返回的Image类型变量img_code, 并在FileName属性中, 输入你要保存图片的地址

9b64d39c464826801f10de1b733a2aff.png

67465119e8cd7a10c0140c33b974abf7.png

27e048dd8dda76a4c1dfd666834c1326.png
  1. 在Activities中搜索Python scope,并将其拖至设计区, 在Path属性中, 输入你的Python 安装路径, Target属性32位选择x86, 64选择x64, Version属性根据你的Python 属性来选择

a3fb171e3b8add0d543e04da4543224e.png

039deeea9b1aff9caba01b8188306262.png
  1. 在Activities中搜索open browser,并将其拖至Python Scope的设计区, 在File 属性中, 输入Python 调用百度OCR的.py文件, 具体代码参考文末. 在Result属性中使用快捷键Ctrl + k自定义变量pyObject, 用来接收返回结果

ec1c4687b7a3c26975af249d3a3dbf4f.png

53565dc18a9ee233c5df6a8497099061.png

564bcb6a4db90058a5f9bda70b7fcf65.png
  1. 在Activities中搜索Invoke Python Method,并将其拖至Python Scope的设计区, 在InputParameters属性中, 输入参数(需要被识别的图片) {“E:uipathBlankProcessBlankProcesscode.png”}, 这里需要用中括号括起来, 在instance属性中输入步骤7的返回结果pyObject, Name属性中输入代码中的调用方法名称baidu_ocr, 在Result属性中使用快捷键Ctrl + k自定义变量outObject, 用来接收返回结果

b3ec4cd2348dc9f239731201b3b7f022.png

95efc9e42d624cd604e720134fbe76d1.png

f00fb3a58a4d2c22fcf1f21dadd86e19.png
  1. 在Activities中搜索Get Python Object,并将其拖至Python Scope的设计区, 在PythonObject属性中输入步骤8的返回结果outObject, 在Result属性中使用快捷键Ctrl + k自定义变量result, 用来接收返回结果

aa27beb9cee5521f1f2917d417cbeb61.png

22ec09b21c30c4b3427d613a1b89fe26.png

339ff1c5b5b54e99d025b97eab0f8a76.png
  1. 在Activities中搜索Log Message,并将其拖至Python Scope的设计区, 在Message 属性中输入result.ToString, 用来打印百度OC识别的结果

b82b797384d54ed0399db26896dd181b.png
  1. 完整流程图及变量

0ae501946d411c2e09a6e55ee7cf7f33.png

2cb876bb33020bc24dc2fa8d88f8af32.png

f7d82dd466bc04870b06f5f97720ee67.png

#运行完成,你会看到日志窗口打印了百度OCR识别后打印的文本值

总结:以上流程就用到了百度OCR识别的操作,大家可以动手试试

附:Baidu_ocr.py的代码

from aip import AipOcrAPP_ID = '你的AppID'API_KEY = '你的API_KEY'SECRET_KEY = '你的SECRET_KEY'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read()def baidu_ocr(path): image = get_file_content(path) client.basicGeneral(image) options = {} options["language_type"] = "CHN_ENG" options["detect_direction"] = "true" options["detect_language"] = "true" options["probability"] = "true" res = client.basicGeneral(image, options) res_str = res['words_result'] res_str_all = '' for i in range(len(res_str)): res_str_a = res['words_result'][i]['words'] res_str_all += res_str_a return res_str_all

文章来源:http://www.rpazj.com

作者:RPA之家

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值