下面免费给大家分享,我提交工单,与百度智能云的工程师沟通,在凌晨4点时终于得到亲测无误的python代码,期间花了8个小时时间。
代码先贴,随后解释
def captcha(self, cap):
app_id = '你的AppID'
api_key = '你的API Key'
secret_key = '你的Secret Key'
client = AipOcr(app_id, api_key, secret_key)
在上面代码中,常量APP_ID在百度智能云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
client.setConnectionTimeoutInMillis(2000)#这两行代码至关重要
client.setSocketTimeoutInMillis(60000)#8个小时的成果
def get_file_content(img):
with open(img, 'rb')as f:
return f.read()
try:
result = client.basicAccurate(get_file_content(cap))#通用识别出来的结果,
except Exception:
sleep(0.2)
self.captcha(cap)
else:#以下代码根据自己需求来改
if 'words_result' not in result.keys():
return self.captcha(cap)
else:
text = result['words_result']
cap_res = ''
for i in text[0]['words']:
try:
int(i)
except ValueError:
pass
else:
cap_res += i
return cap_res
分析代码:
首先,安装两个库PIL和aip,并导入。这两个库安装有些特殊,如果使用的python3直接使用pip install PIL或pip install aip是无法安装的。
PIL:使用Pillow库来安装
pip install Pillow
PIL(Python Imaging Library)是Python一个强大方便的图像处理库,名气也比较大。不过只支持到Python 2.7。
Pillow是PIL的一个派生分支,但如今已经发展成为比PIL本身更具活力的图像处理库
aip:我们打开百度智能云的管理控制台后,可以看到技术文档有说明
pip install baidu-aip
from PIL import Image
from aip import AipOcr
client.setConnectionTimeoutInMillis(2000)#这两行代码至关重要
client.setSocketTimeoutInMillis(60000)#8个小时的成果
这里的代码为什么至关重要?
接口
说明
setConnectionTimeoutInMillis
建立连接的超时时间(单位:毫秒)
setSocketTimeoutInMillis
通过打开的连接传输数据的超时时间(单位:毫秒)
大家看到了吧?一旦超时,就识别不到。我采用的方式:
对识别内容做判断(识别后返回一个字典格式,当没有键[words_result]时,停顿0.2秒继续识别
没有异常的正常代码处理:
需求只是识别,我的处理简单粗暴,对结果进行遍历提取。这里自行打印输出查看