PaddleOCR在 windows下的webAPI部署方案

最新推荐文章于 2024-09-19 13:47:25 发布

dotNET跨平台

最新推荐文章于 2024-09-19 13:47:25 发布

阅读量1.1k

点赞数

文章标签： python java docker linux 人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzAwNTMxMzg1MA==&mid=2654093347&idx=8&sn=77ed4b92a62a43c5c6f643963d77f711&chksm=80d86476b7afed603eaf5ed6432b86cf09f2e64f2a6633dba7c4c36d76d8debe8f322e5aa01c&scene=126&&sessionid=0

版权

很多小伙伴在使用OCR时都希望能过采用API的方式调用，这样就可以跨端跨平台了。本文将介绍一种基于python的PaddleOCR识方案。喜欢的可以关注公众号，获取更多内容。

# 一、 windows环境下部署
###1.环境
操作系统：windows10；
主要软件环境：python3.9X64、opencv4.5.5、PaddleOCR2.5、paddlepaddle2.2.1。python运行环境建议3.6-3.9
###1. 环境安装
###1.1 安装python-3.9.1-amd64.exe
Python官方下载地址[python windows版本下载](https://www.python.org/downloads/windows/ "python windows版本下载")
选择合适的windows版本，下载到本地后，双击进行安装，安装时勾选添加环境变量。

验证是否修改成功，执行以下cmd命令 :

python -V

至此，python3.9安装成功。

###1.2 安装opencv4.5.5

pip3 install opencv-python==4.5.5.64

###1.3 安装PaddleOCR
安装PaddleOCR：

pip3 install paddleocr

如果提示报错缺少Microsoft Visual C++14.0 ,则需要下载安装。
去官网下载对应的文件（需要拥有一个微软的账号），首先，打开链接[my.visualstudio.com](https://my.visualstudio.com/Downloads/Featured?mkt=zh-cn "my.visualstudio.com") ，登录账号，点击进入下载页面；接下来，在下载页面搜索build tools，找到左侧的Visual Studio 2015 update 3。
点击Visual Studio 2015 update 3后，下载对应的文件即可，约1.1G，这里需要将格式修改为DVD。
下载完成后，我们得到了文件mu_visual_cpp_build_tools_2015_update_3_x64_dvd_dfd9a39c.iso，解压后，双击VisualCppBuildTools_Full.exe即可自动进行安装。
安装PaddleOCR的依赖预测库：

pip3 install paddlepaddle

###1.4 安装其他依赖

pip3 install Flask
pip3 install DateTime

至此基本环境搭建完成，接下来即可搭建WebAPI项目了。

###3. OCR部署
####3.1 功能代码（PaddleOCRWebAPI.py）

import io
from pickle import DICT
import paddleocr
import json
import base64
import DateTime
from flask //连接下一行
import Flask, request,jsonify
import numpy as np
from PIL import Image
app=Flask(__name__)


@app.route("/WebAPI/PaddleOCR",methods=["POST"])def PaddleOCR():if(request.data==""):return APIResult.Error("request data is null")
data=json.loads(request.data)
imgbase64=data["image"];
imgbyte=base64.b64decode(imgbase64)
image=io.BytesIO(imgbyte)
temp= Image.open(image)
img=np.array(temp)[:,:,:3]
info= ppocr.ocr(img)
result={"TextBlocks":[]}for textblocks in info:
textBlock={"Points":[],"Text":""}for tk in textblocks[0]:
point={"x":str(tk[0]),"y":str(tk[1])}
textBlock["Points"].append(point)
textBlock["Text"]=textblocks[1][0]
result["TextBlocks"].append(textBlock)print(result)return jsonify(result)def main():global ppocr;
ppocr=paddleocr.PaddleOCR(use_gpu=False);
app.run(debug=True,host="0.0.0.0",port=5000)if __name__=="__main__":
main();

其中

app.run(debug=True,host="0.0.0.0",port=5000)

用于定义WebAPI的IP地址和端口，可根据实际情况部署修改。

启动服务：

python PaddleOCRWebAPI.py

#3.2接口文档
##基本信息
请求方式：POST
url地址：`http://ip:port/WebAPI/PaddleOCR`
数据格式：json
##### 输入参数

变量名	描述	是否必填	类型	备注
image	需要识别文字的图像base64	是	String

##### 输入示例：

{"image": "xxxxxxxxx"}

###输出参数
数据格式：json字符串
输出示例：

{"TextBlocks"://识别出来的文本块数组，[
{"Points"://该数组固定四个大小，为一个识别区域的四个顶点坐标，从左上角开始，顺时针方向。[
{"x":0,"y":0},
{"x":100,"y":0},
{"x":100,"y":50},
{"x":0,"y":50}
],"Text":"中国ABC123"//一个文本区域识别出来的文字},
{"Points":
[
{"x":0,"y":0},
{"x":100,"y":0},
{"x":100,"y":50},
{"x":0,"y":50}
],"Text":"中国ABC123"},
{"Points":
[
{"x":0,"y":0},
{"x":100,"y":0},
{"x":100,"y":50},
{"x":0,"y":50}
],"Text":"中国ABC123"},
......
]
}