简介
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。本文介绍PaddleOCR的快速部署和识别测试,采用最新的识别模型,识别效果很好,平均置信度可达99%。
部署环境:Window10,CPU环境,Python3.10
1、下载PaddleOCR源代码
最新版本是2.7,共127M。源码下载地址如下:
2、PyCharm打开OCR项目,创建python虚拟目录
3、设置源镜像为国内清华大学
为了后续安装依赖包下载速度更快这里修改python的镜像源。
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
4、安装PaddlePaddle框架
安装paddlepaddle最新版2.5.1
python -m pip install paddlepaddle==2.5.1 -i https://pypi.tuna.tsinghua.edu.cn/simple
5、安装项目依赖
pip install -r requirements.txt
6、测试OCR识别
检测+方向分类器+识别,第一次执行脚本会自动下载ppocr轻量级模型作为默认模型。
from pprint import pprint
from paddleocr import PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
img_path = './doc/imgs/ticket.jpg'#火车票
result = ocr.ocr(img_path, cls=True)
pprint(result)
总结
总的来说,PaddleOCR是一个功能丰富、高性能和易用的OCR工具库,适用于各种OCR任务的应用场景。它具有多种OCR任务支持、高性能和高效率、多语言支持、易用性和灵活性以及开源社区支持等优势。无论是个人开发者还是企业用户,都可以通过PaddleOCR快速构建和部署自己的OCR应用。