基础复习_用Python实现图片中的文字识别

最新推荐文章于 2024-08-03 15:35:50 发布

神奇的小卷

最新推荐文章于 2024-08-03 15:35:50 发布

阅读量411

点赞数

文章标签： python 百度数据库 windows 机器学习

本文链接：https://blog.csdn.net/weixin_45640778/article/details/113470750

版权

虽然网络上很多相关软件可以实现图片中的文字识别，
出于新手对基础知识的复习，自己写出的代码也能轻松实现这个目的！
几天前看过的一篇教程，实操起来也是So Easy!

==============================================

1. 监听用户截图的操作
这里用到的截图神器是Snipaste，
其中“F1”是截图的快捷键，“Ctrl+C”是把截图保存到剪贴板的快捷键。
下载地址：
https://zh.snipaste.com/download.html

当然，也可以使用qq或者任意其它截图功能的插件，在代码中输入相应的快捷键就行了。

import keyboard
import time

# 利用键盘监听来获取用户的截图行为，让程序等待用户进行截屏操作。这里hotkey的参数值不分大小写。
keyboard.wait(hotkey="F1")  
keyboard.wait(hotkey="Ctrl+C")
time.sleep(0.3)

这个时候已经有一张图片待在剪切板里了，下面继续。

2.保存截图
利用PIL模块中的ImageGrab，把剪贴板里的那张图片，保存到当前的目录下，并命名为“screen.png”

from PIL import ImageGrab
# 把图片从剪切板保存到当前路径
image = ImageGrab.grabclipboard()  
image.save("screen.png")

3.识别图片中的文字
利用百度API接口，视频文字识别
AI开放平台文档中心：https://ai.baidu.com/ai-doc
在这里插入图片描述
查看python语言的SDK文档

在这里插入图片描述
点击右上角（控制台），登录自己的百度账号，创建“文字识别”的应用

OK，先安装百度API库
pip install baidu_aip
并下载相应的SDK

from aip import AipOcr
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
with open("screen.png", 'rb') as f:
    image = f.read()

    # 调用百度API通用文字识别（高精度版），提取图片中的内容
    text = client.basicAccurate(image)
    result = text["words_result"]
    for i in result:
        print(i["words"])

大功告成，撒花庆祝！

完整代码如下：

import keyboard
from PIL import ImageGrab
import time
from aip import AipOcr

keyboard.wait(hotkey="F1")
keyboard.wait(hotkey="Ctrl+C")
time.sleep(0.3)

image = ImageGrab.grabclipboard()
image.save("screen.png")



""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

with open("screen.png", "rb") as f:
    image = f.read()

    text = client.basicAccurate(image)
    result = text["words_result"]
    words_result_num = text["words_result_num"]
    # print(result)

    print("识别结果数：%d" % words_result_num)
    print("=" * 30)
    for n, i in enumerate(result):
        print(str(n+1) + r"." + i['words'])