执行以下命令安装
pip install paddleocr
因为这个模块依赖paddle,还需要单独安装,若未自行配置过paddle-gpu,那么默认安装的是paddle-cpu
pip install paddlepaddle==2.5.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
简单功能、首先准备一张图片test.jpg
运行代码
from paddleocr import PaddleOCR, draw_ocr
#Paddleocr目前支持中英文、英文、法语、德语、韩语、日语,可以通过修改lang参数进行切换
#参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。
ocr = PaddleOCR(use_angle_cls=True, lang="ch") #首次模型需要在线下载
result = ocr.ocr('test.jpg', cls=True)
for line in result:
print(line)
这里需要注意一下,首次模型需要在线下载所以需要联网
模型的下载后会存在你的本地,路径为C:\Users\你的用户名\.paddleocr\whl
如果无法联网的话,也可以通过U盘从可以联网的电脑上复制。
最后输出结果:
可以看出Paddleocr还是很强的,图片中的文字有一些倾斜。不仅自己修正了图片,识别也非常准确。