PaddleOCR：轻量级文本检测识别框架

TouristLin

已于 2023-05-27 00:50:27 修改

阅读量536

点赞数 1

文章标签：深度学习 pytorch 计算机视觉

于 2023-05-27 00:48:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SoulmateY/article/details/130896204

版权

PaddleOCRV3版本提供了仅10MB的权重文件，实现了在CPU上的高效文本识别。为解决安装环境问题，文章介绍了使用PyTorch版本的实现方式，以及通过Gradio构建的在线推理GUI界面，用户可以访问提供的在线Demo体验。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

PaddleOCR是百度飞桨PaddlePaddle官方推出的图像文本检测与识别算法，被广泛应用于截图翻译、票据识别等领域；在最新的V3版本中，权重文件只需10MB就能实现高精度的文本识别，cpu上也能实现快速推理。
在这里插入图片描述

PaddleOCR的官方教程推荐用paddleocr库来实现推理，但是实际安装时很容易出现环境问题，所以本文使用了pytorch版本（感谢PaddleOCR2PyTorch）写了在线推理脚本，并用Gradio库简单做了GUI界面：
在这里插入图片描述

在线体验链接、Github、代码模型权重放在这里：
在线体验Demo：PaddleOCR-SwanHub
Github：https://github.com/xiaolin199912/PaddleOCR-Online
PP_V3版本模型权重：下载里面的LFS文件

博客等级

码龄6年

83
原创

1500
点赞

2147
收藏

892
粉丝

关注

私信

热门文章

分类专栏

大模型实战教程 1篇
人工智能思考 1篇

最新评论

Stable Diffusion文生图模型训练入门实战（完整代码）
派大星是艺术爆炸: 跟显卡型号关系不大看显卡的内存即显存大小
Stable Diffusion文生图模型训练入门实战（完整代码）
前尘覆海: 为什么4090也会显示out of memory，gpu
Qwen2大模型微调入门实战（完整代码）
超级安安: UnicodeDecodeError: 'gbk' codec can't decode byte 0x90 in position 12: illegal multibyte sequence
Qwen2.5大模型微调实战：医疗命名实体识别（NER）任务（完整代码）
Weach: 请问，lora_rank = 64 lora_alpha =16是训练得出的经验值吗，我看很多人建议alpha设为r得2倍比较好，请教下。（我微调的是qwen2.5-14B，数据集条5000数据）
Stable Diffusion文生图模型训练入门实战（完整代码）
抖音用户: oaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of ./stable-diffusion-v1-5.| 2/6 [00:00<00:00, 6.85it/s] Loading pipeline components...: 100%|███████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00, 19.31it/s] You have disabled the safety checker for <class 'diffusers.pipelines.stable_diffusion.pipeline_stable_diffusion.StableDiffusionPipeline'> by passing `safety_checker=None`. Ensure that you abide to the conditions of the Stable Diffusion license and do not expose unfiltered results in services or applications open to the public. Both the diffusers team and Hugging Face strongly recommend to keep the safety filter enabled in all public facing circumstances, disabling it only for use-cases that involve analyzing network behavior or auditing its results. For more information, please have a look at https://github.com/huggingface/diffusers/pull/254 . 这么停了快半小时了，sd-naruto-model 文件夹里也没任何东西，这是还没验证完还是出什么问题了

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。