PaddleOCR 使用教程
PaddleOCR超轻量级中文OCR模型在线体验
快速安装,用来获取新的下载链接
安装
官网建议准备docker环境,这里使用虚拟环境即可
环境:python 3.7,cuda10.1-cudnn7
1、安装PaddlePaddle Fluid v1.7
pip3 install --upgrade pip
python3 -m pip install paddlepaddle-gpu==1.7.2.post107 -i https://pypi.tuna.tsinghua.edu.cn/simple
#报错如下
#使用 --trusted-host pypi.douban.com 信任该镜像源即可
#pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn paddlepaddle-gpu==1.7.2.post107
#成功
#这里安装新版本,不然后面会报错
python -m pip install paddlepaddle-gpu==2.0.2.post101 -f https://paddlepaddle.org.cn/whl/mkl/stable.html
2、克隆PaddleOCR repo代码
git clone https://github.com/PaddlePaddle/PaddleOCR
3、安装第三方库
cd PaddleOCR
#查看需求文件,安装需求
pip3 install -r requirements.txt
4、使用(出现很多问题,不过还好都解决了)
先检查paddle是否安装成功
通过python下输入两个命令行去判断是否安装成功
>>> import paddle
>>> paddle.utils.run_check()
成功示意图:
问题一:PaddleOCR找不到模型文件,文件夹正确,主要是找不到/inference/ch_det_mv3_db//inference.pdmodel 模型文件,这个是因为除了官网教程上需要下载的模型,还需要补充这个模型,链接地址。
这是tiny版本的模型,v2.0解压后放在和v1.1对应同样的文件夹里面
这是通用版本的
问题二:初次安装好paddle,通过python调用paddle库发现出现np.int错误
解决方法:按照错误提示找到对应py文件地址,gedit打开将出现错误的np.int改为np.int32
问题三:cuda地址正确的情况下,paddle.utils.run_check(),发现libcublas.so找不到
cd /usr/lib/x86_64-linux-gnu/
#名称改一下即可
sudo mv libcublas.so.10 libcublas.so
解决以上三个问题后基本可以使用了,进入PaddleOCR文件目录下,开始演示示例
cd PaddleOCR
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db/" --rec_model_dir="./inference/ch_rec_mv3_crnn/"
以上是采用轻量型的那个模型,用来跑了一下数字符号的识别,有些地方还是有错误,换成通用性的模型基本能识别出来。
tiny版本模型
通用模型
//运行环境
pyenv activate paddleOCR_env
cd PaddleOCR/
//tiny模型
python3 tools/infer/predict_system.py --image_dir="/home/li/test.png" --det_model_dir="./inference_tiny/ch_det_mv3_db/" --rec_model_dir="./inference_tiny/ch_rec_mv3_crnn/"
//标准模型
python3 tools/infer/predict_system.py --image_dir="/home/li/test.png" --det_model_dir="./inference/ch_ppocr_server_v1.1_det_infer/" --rec_model_dir="./inference/ch_ppocr_server_v1.1_rec_infer/"