1、下载paddle源码
https://github.com/PaddlePaddle/PaddleOCR
2、新建conda虚拟环境
conda create --name paddleocr_env python=3.10
3、激活conda虚拟环境
conda activate paddleocr_env
4、解压paddleOCR并进入ocr目录,运行安装所需库:
pip install -r requirments.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
5、创建一个inference目录
mkdir inference && cd inference
6、下载下方的检测模型和识别模型
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar
将模型放到interface下并解压
7、下面开始调用tools/infer/predict_system.py 完成图像文本识别,共需要传入三个参数:
# image_dir: 指定要测试的图像
# det_model_dir: 指定轻量检测模型的inference model
# rec_model_dir: 指定轻量识别模型的inference model
# Prompt下运行,当把单张图片路径改为文件夹路径时会批量识别文件夹下所有图片:
python tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_PP-OCRv3_det_infer/" --rec_model_dir="./inference/ch_PP-OCRv3_rec_infer/"
运行结果如下图
参考文档:https://zhuanlan.zhihu.com/p/525114489