paddleocr学习笔记（一）从官网开始

最新推荐文章于 2024-05-14 07:51:12 发布

落花逐流水

最新推荐文章于 2024-05-14 07:51:12 发布

阅读量2.4k

点赞数 3

分类专栏： PaddleOCR

本文链接：https://blog.csdn.net/juluwangriyue/article/details/113417065

版权

18 篇文章 50 订阅

订阅专栏

English | 简体中文

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

PaddleOCR同时支持动态图与静态图两种编程范式

近期更新

2021.1.26,28,29 PaddleOCR官方研发团队带来技术深入解读三日直播课，1月26日、28日、29日晚上19:30，直播地址
2021.1.25 FAQ新增5个高频问题，总数157个，每周一都会更新，欢迎大家持续关注。
2021.1.21 更新多语言识别模型，目前支持语种超过27种，多语言模型下载，包括中文简体、中文繁体、英文、法文、德文、韩文、日文、意大利文、西班牙文、葡萄牙文、俄罗斯文、阿拉伯文等，后续计划可以参考多语言研发计划
2020.12.15 更新数据合成工具Style-Text，可以批量合成大量与目标场景类似的图像，在多个场景验证，效果明显提升。
2020.11.25 更新半自动标注工具PPOCRLabel，辅助开发者高效完成标注任务，输出格式与PP-OCR训练任务完美衔接。
2020.9.22 更新PP-OCR技术文章，https://arxiv.org/abs/2009.09941
More

PPOCR系列高质量预训练模型，准确的识别效果
- 超轻量ppocr_mobile移动端系列：检测（3.0M）+方向分类器（1.4M）+ 识别（5.0M）= 9.4M
- 通用ppocr_server系列：检测（47.1M）+方向分类器（1.4M）+ 识别（94.9M）= 143.4M
- 支持中英文数字组合识别、竖排文本识别、长文本识别
- 支持多语言识别：韩语、日语、德语、法语
丰富易用的OCR相关工具组件
- 半自动数据标注工具PPOCRLabel：支持快速高效的数据标注
- 数据合成工具Style-Text：批量合成大量与目标场景类似的图像
支持用户自定义训练，提供丰富的预测推理部署方案
支持PIP快速安装使用
可运行于Linux、Windows、MacOS等多种系统

上图是通用ppocr_server模型效果展示，更多效果图请见效果展示页面。

PC端：超轻量级中文OCR在线体验地址：https://www.paddlepaddle.org.cn/hub/scene/ocr
移动端：安装包DEMO下载地址(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统)，Android手机也可以直接扫描下面二维码安装体验。

说明：2.0版模型和1.1版模型的主要区别在于动态图训练vs.静态图训练，模型性能上无明显差距。

模型简介	模型名称	推荐场景	检测模型	方向分类器	识别模型
中英文超轻量OCR模型（9.4M）	ch_ppocr_mobile_v2.0_xx	移动端&服务器端	推理模型 / 预训练模型	推理模型 / 预训练模型	推理模型 / 预训练模型
中英文通用OCR模型（143.4M）	ch_ppocr_server_v2.0_xx	服务器端	推理模型 / 预训练模型	推理模型 / 预训练模型	推理模型 / 预训练模型

更多模型下载（包括多语言），可以参考PP-OCR v2.0 系列模型下载

关注