虽然网络上很多相关软件可以实现图片中的文字识别,
出于新手对基础知识的复习,自己写出的代码也能轻松实现这个目的!
几天前看过的一篇教程,实操起来也是So Easy!
==============================================
1. 监听用户截图的操作
这里用到的截图神器是Snipaste,
其中“F1”是截图的快捷键,“Ctrl+C”是把截图保存到剪贴板的快捷键。
下载地址:
https://zh.snipaste.com/download.html
当然,也可以使用qq或者任意其它截图功能的插件,在代码中输入相应的快捷键就行了。
import keyboard
import time
# 利用键盘监听来获取用户的截图行为,让程序等待用户进行截屏操作。这里hotkey的参数值不分大小写。
keyboard.wait(hotkey="F1")
keyboard.wait(hotkey="Ctrl+C")
time.sleep(0.3)
这个时候已经有一张图片待在剪切板里了,下面继续。
2.保存截图
利用PIL模块中的ImageGrab,把剪贴板里的那张图片,保存到当前的目录下,并命名为“screen.png”
from PIL import ImageGrab
# 把图片从剪切板保存到当前路径
image = ImageGrab.grabclipboard()
image.save("screen.png")
3.识别图片中的文字
利用百度API接口,视频文字识别
AI开放平台文档中心:https://ai.baidu.com/ai-doc
查看python语言的SDK文档
点击右上角(控制台),登录自己的百度账号,创建“文字识别”的应用
OK,先安装百度API库
pip install baidu_aip
并下载相应的SDK
from aip import AipOcr
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
with open("screen.png", 'rb') as f:
image = f.read()
# 调用百度API通用文字识别(高精度版),提取图片中的内容
text = client.basicAccurate(image)
result = text["words_result"]
for i in result:
print(i["words"])
大功告成,撒花庆祝!
完整代码如下:
import keyboard
from PIL import ImageGrab
import time
from aip import AipOcr
keyboard.wait(hotkey="F1")
keyboard.wait(hotkey="Ctrl+C")
time.sleep(0.3)
image = ImageGrab.grabclipboard()
image.save("screen.png")
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
with open("screen.png", "rb") as f:
image = f.read()
text = client.basicAccurate(image)
result = text["words_result"]
words_result_num = text["words_result_num"]
# print(result)
print("识别结果数:%d" % words_result_num)
print("=" * 30)
for n, i in enumerate(result):
print(str(n+1) + r"." + i['words'])