主要功能:python:打开电脑摄像头,百度AI:文字识别
一、准备工作
python:安装opencv模块
百度AI:登录百度AI官网-->产品服务-->人工智能-->文字识别-->概览-->免费尝鲜-->领取资源
二、python调用摄像头
import cv2 as cv#导入模块cap = cv.VideoCapture(0)#调用摄像头,参数0位电脑内置摄像头 while cap.isOpened():#判断是否打开 M1,M2 = cap.read()#读取图像 cv.imshow("测试用",M2)#显示图像 key = cv.waitKey(1) & 0xFF#按键判断 if key == ord(" "):#按空格键退出循环 break # 释放内存 cv.destroyAllWindows() # 释放摄像头 cap.release()
三、调用百度AI
在文字识别的界面,点击左侧公有云服务-->应用列表,新建一个应用。再点击左侧技术文档,打开页面后,选择HTTP-SDK文档--python语言--快速入门,将代码复制,再进入接口说明,将通用文字识别(标准版)代码复制,示例代码如下所示
from aip import AipOcr """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) """ 读取文件 """ def get_file_content(filePath): with open(filePath, "rb") as fp: return fp.read() image = get_file_content('文件路径') url = "https://www.x.com/sample.jpg" pdf_file = get_file_content('文件路径') # 调用通用文字识别(标准版) res_image = client.basicGeneral(image) res_url = client.basicGeneralUrl(url) res_pdf = client.basicGeneralPdf(pdf_file) print(res_image) print(res_url) print(res_pdf) # 如果有可选参数 options = {} options["language_type"] = "CHN_ENG" options["detect_direction"] = "true" options["detect_language"] = "true" options["probability"] = "true" res_image = client.basicGeneral(image, options) res_url = client.basicGeneralUrl(url, options) res_pdf = client.basicGeneralPdf(pdf_file, options) print(res_image) print(res_url) print(res_pdf)
我们将代码删减后得到如下代码
from aip import AipOcr """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) """ 读取文件 """ def get_file_content(filePath): with open(filePath, "rb") as fp: return fp.read() image = get_file_content('文件路径') # 调用通用文字识别(标准版) res_image = client.basicGeneral(image) print(res_image)
四、代码整合
import cv2 as cv from aip import AipOcr """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) cap = cv.VideoCapture(0) """ 读取文件 """ def get_file_content(filePath): with open(filePath, "rb") as fp: return fp.read() while cap.isOpened(): M1,M2 = cap.read() cv.imshow("测试用",M2) key = cv.waitKey(1) & 0xFF#按键判断 if key == ord("s"):#按下s键 cv.imwrite('你的路径',M2)#保存图片 image = get_file_content('上面保存的路径') #获取图片 res_image = client.basicGeneral(image)#识别图片 print(res_image)#输出识别信息 elif key == ord(" "):#空格退出 break # 释放内存 cv.destroyAllWindows() # 释放摄像头 cap.release()