[OCR/Python] 图片文字提取 (百度vs讯飞)

最新推荐文章于 2024-01-25 16:41:24 发布

風の唄を聴け

最新推荐文章于 2024-01-25 16:41:24 发布

阅读量2.9k

点赞数 1

分类专栏： Python 文章标签： OCR 百度AI 讯飞AI

本文链接：https://blog.csdn.net/weixin_42902669/article/details/109706551

版权

本文比较了百度和讯飞的OCR技术，尽管百度的识别效果更优，但讯飞提供的免费调用量更多。文章详细介绍了在Python中使用两家公司的API进行图片文字识别的步骤，并给出了实际操作示例。

摘要由CSDN通过智能技术生成

本文主要介绍百度和讯飞的OCR调用方法, 从结果来看百度的效果要比讯飞好很多, 不过讯飞给的免费流量比百度多很多.

一. 百度OCR

大致流程:

进入百度智能云官网, 注册并登录
在产品服务中选择"文字识别"
在"应用列表"中创建应用, 并记录下 API Key 和 Secret Key
将 API Key 和 Secret Key, 已经要提取文字的图片传入下面的函数即可获得提取出的文字

import sys
import json
import base64
import requests
from urllib.request import urlopen
from urllib.request import Request
from urllib.error import URLError
from urllib.parse import urlencode
from urllib.parse import quote_plus
# 防止https证书校验不正确
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

def parse_img(img, API_KEY, SECRET_KEY):
    # 获取链接
    IMAGE_RECOGNIZE_URL = 'https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic'
    TOKEN_URL = 'https://aip.baidubce.com/oauth/2.0/token'
    
    params = {
   'grant_type': 'client_credentials',
              'client_id': API_KEY,
              'client_secret': SECRET_KEY}
    post_data = urlencode(params