首先创建环境,建议选择python 3.9 ,之前用3.12导致安装包报错
简单使用安装CPU版本即可,代码如下:
python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
然后安装paddleocr
# 安装 paddleocr,推荐使用2.6版本 pip3 install "paddleocr>=2.6.0.3" # 安装 图像方向分类依赖包paddleclas(如不需要图像方向分类功能,可跳过) pip3 install paddleclas>=2.4.3
如果使用图片识别并生成Excel
执行如下代码即可
import os import cv2 from paddleocr import PPStructure, save_structure_res table_engine = PPStructure(layout=False, show_log=True) save_folder = './output' img_path = 'law.jpg' img = cv2.imread(img_path) result = table_engine(img) save_structure_res(result, save_folder, os.path.basename(img_path).split('.')[0]) for line in result: line.pop('img') print(line)
识别效果如下: