最近学习,很多东西都是视频,截图后,又想做成文档保存起来。
刚开始不多,打一下字就很快解决了。
随着时间的推移,现在越来越多的图了,管理起来确实不方便,打字有时也不能很快的解决。
所以就弄了个OCR。
1、首先 pip install baidu-aip
2、去注册个百度去帐号,然后那个OCR的API,获得APP ID,API KEY,API SECRET KEY
3,把程序里
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'
修改成你在百度获得到APP ID,API KEY,API SECRET KEY,
相关百度的文字识别,请参考百度OCR网址:https://ai.baidu.com/ai-doc/OCR/fk3h7xune
4,修改path = "YOUR PATH" #YOUR PATH 如D:\picture\ocr_picture
# -*- coding:utf-8 -*-
import os
def get_image(path):
"""这里可以取到文件夹下全部的jpg与png的图像"""
path_name = path
files = os.listdir(path_name)
file_name_with_path = []
for file in files:
if os.path.splitext(file)[1] == '.png' or '.jpg':
file_name_with_path.append(os.path.join(path, file))
# print(os.path.join(path, file))
return file_name_with_path
from aip import AipOcr
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 读取图片 """
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
def ocr_image(image_with_path):
""" 调用通用文字识别, 图片参数为本地图片 """
image = get_file_content(image_with_path)
client.basicGeneral(image)
""" 带参数调用通用文字识别, 图片参数为本地图片 """
# ocr_result 返回的是jason格式,是一个字典
ocr_result = client.basicGeneral(image,)
# 解析识别的文字
ocr_words = ocr_result["words_result"]
for i in range(len(ocr_words)):
print(ocr_words[i]['words'])
path = "YOUR PATH" #YOUR PATH 如D:\picture\ocr_picture
images = get_image(path)
for image in images:
ocr_image(image)
这是要识别的图像,
这是识别的结果,还不错。基本没有错的。