python ocr 文字识别软件,Python文字截图识别OCR工具实例解析

一、简介

你一定用过那种“OCR神器”,可以把图片中的文字提取出来,极大的提高工作效率。

今天,我们就来做一款实时截图识别的小工具。顾名思义,运行程序时,可以实时把你截出来的图片中的文字识别出来。

二、模块

import keyboard # 用于监控键盘按下,触发事件(pip install keyboard)

import time

from aip import AipOcr # 调用百度接口(pip install baidu-aip)

from PIL import ImageGrab # 用于保存屏幕截图

三、获取百度应用接口

AI开放平台文档中心

https://ai.baidu.com/ai-doc

q0qwhcurrwb.jpg

查看python语言的SDK文档

r0rxhcmh5ok.jpg

点击右上角(控制台),登录自己的百度账号,创建“文字识别”的应用

clhq3k31034.jpg

4vvm2rttnoi.jpg

四、代码实现

#! /usr/bin/env python3

# -*- coding:utf-8 -*-

# Author : MaYi

# Blog : http://www.cnblogs.com/mayi0312/

# Date : 2020-03-02

# Name : test_ocr

# Software : PyCharm

# Note : 用Python开发截图识别OCR小工具

import keyboard # 用于监控键盘按下,触发事件(pip install keyboard)

import time

from aip import AipOcr # 调用百度接口(pip install baidu-aip)

from PIL import ImageGrab # 用于保存屏幕截图

# 百度识别接口配置信息

APP_ID = '你的App ID'

API_KEY = '你的API Key'

SECRET_KEY = '你的Secret Key'

while True:

# 1、利用QQ截图到剪贴板

# 输入键盘的触发事件

keyboard.wait(hotkey="ctrl+alt+a")

keyboard.wait(hotkey="enter")

time.sleep(0.1)

# 2、保存截图

image = ImageGrab.grabclipboard()

image.save("screen.png")

# 3、利用百度API识别截图中的文字

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

with open("screen.png", 'rb') as f:

image = f.read()

# 调用百度API通用文字识别(高精度版),提取图片中的内容

text = client.basicAccurate(image)

result = text["words_result"]

for i in result:

print(i["words"])

# 我是分隔线

print("-" * 50)

运行结果预览:

yfnxg0q5h3z.jpg

五、总结

1)等待用户截图

2)保存截图到当前目录

3)识别截图中的文本

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持聚米学院。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值