[OCR/Python] 图片文字提取 (百度vs讯飞)

本文比较了百度和讯飞的OCR技术,尽管百度的识别效果更优,但讯飞提供的免费调用量更多。文章详细介绍了在Python中使用两家公司的API进行图片文字识别的步骤,并给出了实际操作示例。
摘要由CSDN通过智能技术生成

本文主要介绍百度和讯飞的OCR调用方法, 从结果来看百度的效果要比讯飞好很多, 不过讯飞给的免费流量比百度多很多.

一. 百度OCR

大致流程:

  1. 进入百度智能云官网, 注册并登录
  2. 在产品服务中选择"文字识别"
    在这里插入图片描述
  3. 在"应用列表"中创建应用, 并记录下 API KeySecret Key
    在这里插入图片描述
  4. 将 API Key 和 Secret Key, 已经要提取文字的图片传入下面的函数即可获得提取出的文字
import sys
import json
import base64
import requests
from urllib.request import urlopen
from urllib.request import Request
from urllib.error import URLError
from urllib.parse import urlencode
from urllib.parse import quote_plus
# 防止https证书校验不正确
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

def parse_img(img, API_KEY, SECRET_KEY):
    # 获取链接
    IMAGE_RECOGNIZE_URL = 'https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic'
    TOKEN_URL = 'https://aip.baidubce.com/oauth/2.0/token'
    
    params = {
   'grant_type': 'client_credentials',
              'client_id': API_KEY,
              'client_secret': SECRET_KEY}
    post_data = urlencode(params
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值