PaddleOCR是百度飞桨PaddlePaddle官方推出的图像文本检测与识别算法,被广泛应用于截图翻译、票据识别等领域;在最新的V3版本中,权重文件只需10MB就能实现高精度的文本识别,cpu上也能实现快速推理。
PaddleOCR的官方教程推荐用paddleocr库来实现推理,但是实际安装时很容易出现环境问题,所以本文使用了pytorch版本(感谢PaddleOCR2PyTorch)写了在线推理脚本,并用Gradio库简单做了GUI界面:
在线体验链接、Github、代码模型权重放在这里:
在线体验Demo:PaddleOCR-SwanHub
Github:https://github.com/xiaolin199912/PaddleOCR-Online
PP_V3版本模型权重:下载里面的LFS文件