Github Star 8.5K，超级好用的OCR数据合成与半自动标注工具，强烈推荐！

最新推荐文章于 2024-04-30 04:44:45 发布

_k同学

最新推荐文章于 2024-04-30 04:44:45 发布

阅读量542

点赞数

分类专栏：分享文章标签：编程语言 python

本文链接：https://blog.csdn.net/XIe_0928/article/details/113184776

版权

PaddleOCR是一款备受瞩目的OCR开源项目，其新发布的Style-Text数据合成工具和PPOCRLabel半自动标注工具大大提升了数据处理效率。Style-Text能批量合成类似目标场景的图像，而PPOCRLabel使标注效率提升60%以上。此外，多语言识别模型性能得到优化，PP-OCR开发体验进一步升级，支持动态图和静态图的转换，提供更好的训练和部署体验。

摘要由CSDN通过智能技术生成

一、导读

OCR方向的工程师，一定需要知道这个OCR开源项目：PaddleOCR

短短几个月，累计Star数量已超过8.5K，

频频登上Github Trending 日榜月榜，

称它为 OCR方向目前最火的repo绝对不为过。

最近，它又带来四大新发布与升级：

核心内容先睹为快：

全新发布数据合成工具Style-Text： 可以批量合成大量与目标场景类似的图像，在多个场景验证，效果均提升15%以上。
全新发布半自动数据标注工具PPOCRLabel： 有了它数据标注工作事半功倍，相比labelimg标注效率提升60%以上，社区小规模测试，好评如潮。
多语言识别模型效果升级： 在开源测试集评估，中文、英文、韩语、法语、德语、日文识别效果均优于EasyOCR。
PP-OCR开发体验再升级： 支持动态图开发（训练调试更方便），静态图部署（预测效率更高），鱼与熊掌可以兼得。

二、PaddleOCR历史表现回顾

先看下PaddleOCR自去年6月开源以来，短短几个月在GitHub上的表现：

6月，8.6M超轻量模型发布，GitHub Trending

最低0.47元/天解锁文章

_k同学

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Github Star 8.5K，超级好用的OCR数据合成与半自动标注工具，强烈推荐！

一、导读OCR方向的工程师，一定需要知道这个OCR开源项目：PaddleOCR短短几个月，累计Star数量已超过8.5K，频频登上Github Trending 日榜月榜，称它为OCR方向目前最火的repo绝对不为过。最近，它又带来四大新发布与升级：核心内容先睹为快：全新发布数据合成工具Style-Text：可以批量合成大量与目标场景类似的图像，在多个场景验证，效果均提升15%以上。全新发布半自动数据标注工具PPOCRLabel：有了它数据标注工作事半功倍，...
复制链接

扫一扫