关于使用百度PaddleOCR的记录

最新推荐文章于 2024-06-01 23:15:00 发布

wslovelcy

最新推荐文章于 2024-06-01 23:15:00 发布

阅读量1k

点赞数

分类专栏：日常总结文章标签： docker 人工智能深度学习 python java

本文链接：https://blog.csdn.net/wslovelcy/article/details/115689925

版权

本文记录了在Docker环境下安装和部署百度PaddleOCR的过程，包括CPU和GPU版本的设置，强调了GPU配置的注意事项和解决坑点，如CUDA、cuDNN的安装，以及Dockerfile的修改。同时提到了Docker镜像的制作、启动和测试，以及服务性能的初步评估。

摘要由CSDN通过智能技术生成

关于使用百度PaddleOCR的记录【有一定的docker基础】

最近公司要自己弄个OCR的服务，说买的太贵，使用openAPI 的话，涉及到数据泄密，因为是YL资料。

下载paddleOCR
github 很慢，gitee 也可以，
git clone https://gitee.com/PaddlePaddle/PaddleOCR.git /PaddleOCR 下载，github 也可以
Docker化部署，其他类型自己启动，暂时不考虑，试验过，不友好。
[English](README.md) | 简体中文

## Docker化部署服务
在日常项目应用中，相信大家一般都会希望能通过Docker技术，把PaddleOCR服务打包成一个镜像，以便在Docker或k8s环境里，快速发布上线使用。

本文将提供一些标准化的代码来实现这样的目标。大家通过如下步骤可以把PaddleOCR项目快速发布成可调用的Restful API服务。（目前暂时先实现了基于HubServing模式的部署，后续作者计划增加PaddleServing模式的部署）

## 1.实施前提准备

需要先完成如下基本组件的安装：
a. Docker环境
b. 显卡驱动和CUDA 10.0+（GPU）
c. NVIDIA Container Toolkit（GPU，Docker 19.03以上版本可以跳过此步）
d. cuDNN 7.6+（GPU）

## 2.制作镜像
a.切换至Dockerfile目录（注：需要区分cpu或gpu版本，下文以cpu为例，gpu版本需要替换一下关键字即可）
```
cd deploy/docker/hubserving/cpu
```
c.生成镜像
```
docker build -t paddleocr:cpu .
```

## 3.启动Docker容器
a. CPU 版本
```
sudo docker run -dp 8868:8868 --name paddle_ocr paddleocr:cpu
```
b. GPU 版本 (通过NVIDIA Container Toolkit)
```
sudo nvidia-docker run -dp 8868:8868 --name paddle_ocr paddleocr:gpu
```
c. GPU 版本 (Docker 19.03以上版本，可以直接用如下命令)
```
sudo docker run -dp 8868:8869 --gpus all