坑1,不要使用中文的电脑名,需要一个英文的用户名。中文名字,会莫名出问题。这个也是常见的坑之一了。如果不方便改名字,可以新建一个用户并使用英文名字。
之后可以按飞桨AI Studio - 人工智能学习与实训社区 (baidu.com)
PaddleHub一键OCR中文识别(超轻量8.1M模型,火爆) - 飞桨AI Studio (baidu.com)飞桨PaddlePaddle-源于产业实践的开源深度学习平台 来安装飞桨ocr。
或者直接安装以下包
pip install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install shapely -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install pyclipper -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
############
安装完以上包后 需要下载模型,也可以不下载,让程序运行的时候自动下载
需要在python下输入想安装的模型信息(取决于需要用到的模型)
!!! 注意pip 版本不能太低 实测22.1.2 可用
############
hub install chinese_ocr_db_crnn_mobile==1.1.2
注意官网给的历程中 images 变量应该是list ,并且其元素应该是ndarray,同样 paths 变量赋值时也应该注意是list(列表)类型
results = ocr.recognize_text(
images=[np_images], # 图片数据,ndarray.shape 为 [H, W, C],BGR格式;
# paths=['./test_p.jpg'],
use_gpu=False, # 是否使用 GPU;若使用GPU,请先设置CUDA_VISIBLE_DEVICES环境变量
output_dir='ocr_result', # 图片的保存路径,默认设为 ocr_result;
visualization=True, # 是否将识别结果保存为图片文件;
box_thresh=0.5, # 检测文本框置信度的阈值;
text_thresh=0.5)
results 的格式可以参考 飞桨AI Studio - 人工智能学习与实训社区 (baidu.com)中的提示。
其他
遇到 core_avx 问题,可能是电脑没有装 VC_redist.x64软件。可以在微软官网下载并安装