Python实战，截图识别文字，过万使用量版本？

最新推荐文章于 2022-03-01 11:27:17 发布

不想秃头的晨晨

最新推荐文章于 2022-03-01 11:27:17 发布

阅读量253

点赞数 1

分类专栏： python 基础爬虫文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/chenchen5152/article/details/121741917

版权

Python实战，截图识别文字，过万使用量版本？

一、获取百度智能云token
二、百度借口调用
三、搭建窗口化的程序以便于使用
四、实现截图的自动保存
五、将识别到的文字输出显示在窗口文本框中并将文字发送到剪切板
六、提取识别后文字中的中（英）文

前人栽树后人乘凉，以不造轮子为由

使用百度的图片识字功能，实现了一个上万次使用量的脚本。

系统：win10

Python版本：python3.8.6

pycharm版本：pycharm 2021.1.2(Professional Edition)
　　在这里插入图片描述

一、获取百度智能云token

百度智能云登录后找到人工智能界面下的文字识别->管理界面创建应用文字识别。

创建应用完成后记录下，后台界面提供的AppID、API key、Secret Key的信息在这里插入图片描述
接下来根据官方提供的文档获取使用Token

# encoding:utf-8
import requests
# client_id 为官网获取的AK， client_secret 为官网获取的SK
host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=wgEHks0l6MCpalbs3lPuFX1U&client_secret=Z4Rn4ghBx9k06fUYPmSEIRbCFvWFxLyQ'
response = requests.get(host)
if response:
    print(response.json()['access_token'])

在这里插入图片描述

二、百度借口调用

使用获取后token调用百度接口对图片进行识别提取文字

# encoding:utf-8

import requests
import base64
'''
通用文字识别（高精度版）
'''
request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"
# 二进制方式打开图片文件
f = open('图片.png', 'rb')
img = base64.b64encode(f.read())
params = {
   "image":img}
# 获取后的Token的调用
access_token = '24.0d99efe8a0454ffd8d620b632c58cccc.2592000.1639986425.282335-24065278'
request_url = request_url + "?access_token=" + access_token
headers = {
   'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
    print (response.json()