本文主要介绍百度和讯飞的OCR调用方法, 从结果来看百度的效果要比讯飞好很多, 不过讯飞给的免费流量比百度多很多.
一. 百度OCR
大致流程:
- 进入百度智能云官网, 注册并登录
- 在产品服务中选择"文字识别"
- 在"应用列表"中创建应用, 并记录下 API Key 和 Secret Key
- 将 API Key 和 Secret Key, 已经要提取文字的图片传入下面的函数即可获得提取出的文字
import sys
import json
import base64
import requests
from urllib.request import urlopen
from urllib.request import Request
from urllib.error import URLError
from urllib.parse import urlencode
from urllib.parse import quote_plus
# 防止https证书校验不正确
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
def parse_img(img, API_KEY, SECRET_KEY):
# 获取链接
IMAGE_RECOGNIZE_URL = 'https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic'
TOKEN_URL = 'https://aip.baidubce.com/oauth/2.0/token'
params = {
'grant_type': 'client_credentials',
'client_id': API_KEY,
'client_secret': SECRET_KEY}
post_data = urlencode(params